《无尺度现象引发的网络变革解读.docx》由会员分享,可在线阅读,更多相关《无尺度现象引发的网络变革解读.docx(11页珍藏版)》请在优知文库上搜索。
1、无尺度现象引发的网络变革中国工程物理研究院李幼平2005.3.7深圳(一)万维网演化为无尺度网络网络改变了文化传播,大家已经谈了很多。今天,我们从无尺度现象谈起,讨论文化对网络的反作用。十几年之前,Web效劳进入互联网,开始了网络的文化应用。正是从那个时候起,互联网的网站与网民才开始快速增长,网络才有兴旺兴旺的今天。这是人类的文化活动影响网络的第一种反作用。第二种反作用鲜为人知。最近几年,美国科学家A.LBarabasi等人用统计物理学的实验方法发现,文化活动悄悄改变着网络运作的数学模型,由原先正态分布的随机模型转变为赛次分布的无尺度模型。“无尺度”是什么意思?这里需要做一点解释。原来,理论家
2、把庞大复杂的网络,分解为“节点”node和“连接”link两大要素。提供内容的网站和接受内容的网民统称为“节点”,内容在节点间的运动称为“连接”。一个网站的社会作用或文化地位,可以用该网站与外界的连接数k来衡量。如果某个网站很长时间也没有人来连接,说明网站的社会影响不大,文化地位不高;反过来,如果连接频繁,作用就大,地位就高。网民对网站的访问,可以说是独立、自由的,完全取决于网民本人的主观意愿。在做大量统计实险之前,科学家预测,连接数k应当服从泊松分布或正态分布,即每个网站的被访问量差异不会太大,就像人类身高差异不会太大那样。然而,实测结果推翻了这个预测。Barabasi等人设计了一种软件,可
3、以从一个节点跳到另一节点,收集并记录网上的所有连接。在对几十万个节点进行统计之后,发现了令人惊异的结果:当绝大多数网站的连接数很少的情况下,却有极少数网站拥有高于普通网站百倍、千倍甚至万倍的连接数。就像在茫茫人海中突然发现假设干身高数百尺巨人那样,令人意外。巨人的身高之大,已不能用普通人高度的尺度来度量,于是想出了“无尺度”的用词,形容少数节点连接数大大超出普通节点的现象。上述实验结果可以用赛次定律表达:出现连接数为k的概率Pk,反比于k的n次方。其中,n称为赛数,它是很接近于2的一个常数。赛次定律告诉我们,尽管万维网提供内容的网站很多很多,网页更是天文数字,但是,有能力长时间吸引众多网民大量
4、访问的网站,为数非常有限。我们用连接数作判据,可以把少数对社会奉献特别大的热门网站从茫茫无边的信息海洋中别离出来。统计物理学家习惯于把服从幕律分布的现象称为无尺度现象。也就是说,人类的文化活动已使万维网演化成为无尺度网络scalefreenetworko我们在实际网络中看到的现象正是如此。尽管中国向网民提供内容的网站有六十万个,但是,其中只有为数不多的网站,才拥有网民一次访问难以穷尽的丰富内容,拥有接纳许多人同时访问的足够带宽,有条件演化成热门网站。拥有大连接数的热门网站,除了新浪、Google.YahOO等门户网站外,就是己经上网的报纸、期刊、通讯社、电台之类的专业“网络传媒:在某种意义上可
5、以说,正是网络传媒的客观存在,影响了网络运作的数学模型。无尺度现象不仅仅出现在万维网中,在神经网络、细胞网络甚至人际网络中均有表达。可以说,凡有生命的地方,有进化、有竞争的地方都有不同程度的表达。社会学家所说的“马太效应”,新约圣经所说“凡有的,还要加给他,叫他有余”,同无尺度现象也有某种相通之处。二无尺度现象的信息学意义无尺度现象的成因,可以从多种角度解释。Barabasi等人解释,优先连接性和网络的成长性是两个起因。所谓成长性指网民网页急剧增加,优先连接性指新网民总是优先选择前人经常访问的网站。随着时间的演进,某些热门的网站愈加热门,不知名的网站愈加冷门。计算机仿真可以演示验证,万维网如何
6、由相对均衡分布的随机网络逐渐演化为极不均衡分布的无尺度网络。哲学家解释:存在决定意识。某人选择连接某一网站,虽然是一种个人意识。但人类生活在同一地球上,相同或者相似的客观境遇,使得人群中有相同或相似的个人意识。大量的统计,把深藏于个性中的共性强烈地反响出来了。充分的自由民主,在一定条件下,有可能转化为高度的集中统一,是“对立统一”的例证,一点也不值得奇怪。以DNA作例子,DNA虽然是个性的标志,但人与人之间的码元,99%以上是相同的,说明个性中潜在共性。无尺度现象给信息科技工作者带来很多启示。首先,让大家认识到,信息社会同时兼有“大世界”与“小世界”两种属性。一方面,网民、网页、带宽随时间快速
7、成长,使得万维网成为名符其实的全球范围内的巨大网罗worldwideweb。另一方面,每个人一天之内所能接受的信息,受到生理带宽与生理精力的限制,又是一个不随时间变化的小世界。大世界与小世界之间,技术世界同“以人为本”的人文世界之间,存在明显的差异与矛盾。矛盾的主要方面在用户端。用户感觉到,数十万网站和数百亿网页,犹如“信息孤岛”,实在难以分别直接面对。他们希望能出现一种承大启小的“中间代理”,用户很容易对这个统一的中间代理表达自己的需求,有兴趣的内容又会通过中间代理主动地流入自己的家中。“中间代理”是什么?它正是无尺度现象所指出的、由热门网站构成群体。由数百或数千资源构成的热门群体,是网民通
8、过民主的方法由大家“选举”出来的,是人类文明进程的自然产物,值得我们倍加珍惜。无尺度现象还从理论层次启发信息工信息共享和物质共享存在本质差异。信息共享的本质,是信源母体不限数量scalefree)的复制copy;物质共享的本质,只是资源母体有限量的瓜分share)。这是人类对信息共享认识上的一次突破。在此之前,人类习惯于用“信息公路”比喻网络中的信息共享。皆然是公路,“车多路堵、人多网堵”便是不可防止的。好似限制享用的人数是天经地义的。当前不少专家仍旧认为,要增加享用人数,除了带宽化,就没有别的出路了。带宽是一种物质性资源,服从总量守衡,分给了你,别人可能就没有了。不管怎么配,享用的人数总是有
9、限。我们认为,必须用科学的语言,揭示“信息高速公路”比喻的局限性。在2003年第五期SCIENTIFICAMERRICAN发表的BarabaSi等人的著名论文中,就用图1美国高速公路和航空运输的图形差异,来说明随机网络与无尺度网络的差异。图1引用科学第七期47页的图随机网络VS无尺度网络机网络可以用薨Sl高速公踣系幔为代覆(左上为句化89).X中包含一整节点和自机布置的速结.在这料奥依的网络中.节点连络的分布将遗e仲影曲线分布(左下图).校感这为分布.大部分子点我有的连绪心目都短不多.与之相反,HD8航空网就是无尺度购络的代衰(右上为簿化图).它存在国有大连结的编依?点(红色).在这聆类0的网
10、络中,节点与七点之阍的连结分布M次定律(右下圈左算中大部分的尊点只有少H连结.而少数节点射拥春大的连络.从这聆意义上来说,这阱网络是一无尺Mr的.这异系坡的定义特愎是.若将方.&连结依的分布双对依番在双对总坐标上.结祟将成一直线(右下留右)随机网络节点点结败的钟影曲线分布节点连结数的*次定律分布连结依连结H连结跤(对H生标)也就是说,无尺度现象鼓励我们去寻找一种没有带宽瓶颈、不限制网民人数的个性化效劳机制,把Web效劳推向一个全新高度。当今互联网的web效劳,包括执行IPV6协议的下一代互联网,尽管网民地址数根本不限量了,但没有根本解决过多网民引起的带宽瓶颈问题。三整合上千网站,形成主流群体无
11、尺度现象启示我们打造国家级文化群体的灵感。只要把几千个甚至几百网站整合起来,就可以形成满足社会上绝大多数人群需求的“普适化”主流媒体;如果技术上想出方法,能让主流群体普及下去,普及到每个村庄或家庭,就可以在普及数字文化的进程中实现历史性跨跃。下面简单介绍目前国人正在做的一些工作。北京应用物理与应用数学研究所的几位年青人,在水鸿寿、陈谋松研究员的带着下,根据中国互联网中心CNNIC发表的实测数据,初步建立我国万维网网站连接数、网站数、分流比的数学模型,验证了无尺度现象符合国情,并推算出霸律常数大约为2.124.依此模型推算,当99.5以上的网站连接数均低于100次时,却有万分之四的网站大于100
12、O次,十万分之三的网站超出IoOOOo次。可见,网站的社会作用与文化地位差异悬殊,只要把总数千分之五约三千个的、有群众文化意义的网站整合起来,就可以形成某种主流文化群体,满足99%以上的访向需求。如果整合一千个网站大约能满足95%的访问要求。整合名列前茅的一千至三千个网站,相当是把全国最有影响力的报纸、期刊、网站、出版社统统并列起来,其内容极其丰富多样,每一个普通百姓,都可以从中找到自己有兴趣的读物,是一种普适(pervasive于全民的新概念超级传媒。如果我们能用现代科技手段,在2015年之前把这个巨无霸式的超级传媒向全国传播,对重振中华文化将有难以估量的战略意义。四普及数字文化的网格年代人
13、们把计算机的普及划分为Net、Web和Grid三个时代。如图2所示,纵座标P为普及指数(pervasiveindex),代表参加联网的计算机总数与人口总数之比。图2,普及计算机网络的三个时期在互联网诞生初期的Net时期,网络仅仅作为科学家之间的一种联络工具,联系数量不多的计算机。这个时期平均每一万人才有一台计算机,P值小于万分之一。九十年代之后,Web的应用开始了网络的公众认可期,万维网作为搜寻信息的文化工具,采用一对多的Client/server结构,p值跃升到0.01至0.1。2005年之后,将逐渐进入广泛应用计算机的Grid网格时代,目标是全人口通过计算机共享信息,采用pervasive
14、/Grid结构,计算机成为一种普及化的工具,联网的计算机总数将接近甚至超过人口总数,P接近或超过1o无尺度现象的发现,使人们认识信息共享与物质共享存在本质差异,认识到普及数字文化不应该像今天这样艰难,为网格理想的早日实现坚决了信心。下面我们将进一步闸明,放弃仅仅依靠IP协议的单边主义思维,不难发现:卫星数字播送就是一种不限使用人数、满足SCaIefree要求的技术手段,利用中间缓存环节,对最终用户构成双向互动的机制,就可以形成“规模无上限”的个性化效劳网格。五卫星播送定比实验的结果2004年六月,清华大学力合公司接受我们的速议,通过卫星进行码分并播定比实验。实验只利用DMB-S数十Mbps转发
15、能力中的0.5Mbps,故称为定比下推seaIingdown实验。把0.5Mbps再划分为16个子信道,每个子信道32kbps。每一个子信道分工传输一种文化传媒一种报纸,一个网站或一门课件,看每24小时能把多少字节的文化内容无过失地送到全国各地。实验说明:在三遍以上重覆播送条件下,每个子信道每天都能把超过100MB的多媒体内容无过失镜象落地。根据定比上推(SCaIingUP)得知,每一个卫星转发器每天有能力把总数达100GB以上的文化内容无过失在全国镜象落地。这是一个十分鼓舞人心的数据。因为,我国已经在本世纪初根本完成“播送电视村村通”工程,只要把当今的视频内容改为符合多媒体格式的报刊、网站内容,就可以克服数字鸿沟,把“播送电视村村通”变成“报刊网站村村通二数字文化通过卫星直接为全民效劳,包括直接为农村、农民、农业效劳的理想,出现了转机。剩下来需要答复的问题是:上千种报刊、网站,每24小时有多少兆字节的新增内容日增量需要卫星去镜象落地?北京应用物理与计算数学研究所联合国家图书馆,在对名列前茅的几家大牌传媒的日产量进行了考察之后,又研究了某些典型中、小媒体的日增量,得出一个猜想:全国主流传媒的日增量小于30GB如果这个猜想能够得到证实,就能证明通过卫星播送与镜象收存实现网格的理想是现实可行的。顺便向大家报告,西南科技大学和绵阳九洲公司已经在2004年度内完成了大规模