读书笔记 · 2020年 5月 5日

《信息简史》

[美]詹姆斯·格雷克. (2013). 信息简史 (图灵新知 1)

扉页

所谓量纲,就是测量的基本单位。
理论允许意识‘跳出自身的影子’,超越经验而把握超验,但这只能借助抽象符号实现(这一点是不证自明的)。
万物源自比特( It from Bit)。
这为我们提供了另一种方式来解读观察者悖论:实验结果会因为它是否被观察到而受影响,甚至被决定。观察者不仅在观察,而且还在提问和讲述,而这些提问和讲述最终都必须由离散的比特表示出来。
尽管我们可以阅读他们留下的著作,但我们很难重拾那种无邪、无知而蒙昧不察的状态。
每一种新出现的信息技术,都在当时催生了信息存储和传输的新需求。

第 1 章 会说话的鼓(似是而非的编码)

这种编码后来被称为点–划字母表,但没有提及的停顿也同等重要,因此,摩尔斯电码并不是一种二进制语言。
鼓语中有许多定型的长尾巴,它们引入的冗余克服了歧义。
事实上,每一种自然语言都内在地包含冗余,这也是为什么人们可以读懂错别字连篇的文章,可以在嘈杂的房间里听懂交谈内容的原因。

第 2 章 持久的文字(心智中并无词典)

一旦被人传唱,这些事迹就不再只属于他自己,而是已经属于听到这吟唱的每个人。
所谓历史,正是有了文字才成其为历史。过去之所以能够称为过去,全靠文字来记录轨迹。
我们希望采用历史和逻辑的方法来理解文字的起源,可是历史和逻辑本身就是文字思维的产物。
你这个发明结果会使学会文字的人们善忘,因为他们就不再努力记忆了。他们就信任文字,只凭外在的符号再认,并非凭内在的脑力回忆。所以你所发明的这剂药,只能医再认,不能医记忆。至于教育,你所拿给你的学生们的东西只是真实界的形似,而不是真实界的本身。
借助文字,一个人可以向众多人说话,死者可以向生者说话,生者可以向未生者说话。
汉字还可以由构成元素的相对位置不同而区分含义,比如直立为(人),横陈为(尸)。
口语文化中的人缺乏范畴的观念,
1972年,斯坦福大学的计算机科学先驱高德纳研究了一块平装书大小的古巴比伦泥板残片。

第 3 章 两本词典(我们文字的不确定性以及我们拼写的随意性)
夏娃( Eva)反拼,圣母( Ave)显现。
英语的历史始终伴随着外来语的侵蚀和充实。它最古老的核心词汇,也就是那些被认为最基础的单词,来源于盎格鲁人、撒克逊人、朱特人,这些日耳曼民族在公元五世纪时跨过北海进入英国,赶走了原来定居的凯尔特人。
有些出过远门的绅士,回到家乡以后,除了爱穿外国的奇装异服四处招摇外,还喜欢在说话时夹杂外语。比如最近从法国归来者,就满口带法国腔的英语,并且也居然不以为耻。
考德里的著作就是第一本英语词典,不过 dictionary(词典)一词并未包含在内。
拉丁语似乎比英语要可靠些,因为它较少在日常使用中被滥用,但它也缺少很多必要的概念。
现如今,英语不再是一门在一个小岛上由寥寥五百万居民(其中大多数为文盲)所使用的语言了。
to drink the Kool- Aid:表示无条件的服从和忠诚。(gem: 参见人民圣殿教和琼斯镇惨案)

第 4 章 将思想的力量注入齿轮机械(喔,欣喜若狂的算术家啊!)

有闲阶级很难能够找到什么比考察自己国家的工坊更有趣、也更有益的事了。这些工坊包含着丰富的知识宝藏,富人阶级却一般对此视而不见。
当初在 1504年,克里斯托弗·哥伦布最后一次起航前往东印度群岛时,他带了一本由雷吉奥蒙塔努斯( Regiomontanus)编纂、于古登堡发明活字印刷术二十多年后在纽伦堡印制的星历表,借此他准确预测了一次月食,从而赢得了土著居民的帮助,最终才得以回国。
“计算员”( computer)的职业在那时就已经有了,他们都是具有特殊技能的人。因此总而言之,计算的成本高昂。
他是莫奇斯顿城堡的第八代领主、神学家和著名的天文学家,还爱好数学。
极点之星、仙女的腰带、鲸鱼肚、竖琴上的最亮点,以及大熊尾巴上最紧挨着它屁股的第一颗星,等等。
从那时起一直到电子计算机出现以前,人类大部分的计算都是借助对数进行的。
次年的《航海天文历》不得不再放入一条“对泰勒的《对数表》的勘误的勘误的勘误。
“有限差分方法”已经经过了数学家(尤其是法国数学家)的近百年研究。它的威力在于能将高阶计算简化为单纯的加法,而且很容易程序化。
因此他将源自这个设想的机器命名为差分机。
他对于英国人看待技术发明的态度也不无不满:“如果你对他说,有一台机器能削土豆,他会宣称这不可能;而如果你当面用机器削给他看,他又会宣称这玩意儿没用,因为它不能切菠萝。”
爱达是“爱的结晶,——尽管她生于苦难,长于动乱”,她的父亲这样写道。
我不能说自己掌握了一个命题,除非我能在眼前想象出一幅图,并能在不借助任何书籍或提示的情况下,将整个建构和证明过程仔细梳理一番。
想象力——这是尤为宝贵的特质。她思虑及此,以为这是从她那素未谋面的父亲那里遗传而来的。
为此她设计了一个过程、一组规则以及一系列运算。在一个世纪后,这会被称为一种算法,或一个计算机程序,可是在当时,要解释这个概念还颇费周章。最不容易理解的一点是,她的算法是递归的。
在她面前将集结起一个个军团,对此即便是地上的铁腕统治者们也只能乖乖让路。

第 5 章 地球的神经系统(就那么几根破电线,我们能指望它什么呢?)

在英国这个游戏叫做中国悄悄话( Chinese Whispers),在中国叫做以讹传讹,在土耳其叫做咬耳朵( From Ear to Ear),而在现代美国则直接叫做打电话( Telephone)。
使用编码书写出于两种密切相关的动机:为了保密以及为了简明。

第 6 章 新电线,新逻辑(没有别的什么东西比它更严密地为未知所包裹)

香农有着一颗爱发明、爱玩耍的心,成年之后也依然保持着那份童真。终其一生,他都在玩游戏和发明游戏。他爱摆弄各种小机械和小装置。
数学家的主要技能是擅长在一个高层次上运用
这样的题目在电气工程学的学生中是前所未见的,当时典型的论文题目通常是如改进电动马达或传输线路等。
可惜的是,他并未公开发表这篇论文。
她被克劳德气质中的深沉阴郁以及智力上的才华横溢所深深吸引。
metaphysics(形而上学)的前缀 meta-在希腊语中意为“之后”,指在亚里士多德作品集中,有关逻辑、意义等抽象知识的讨论被编排在了物理学( physics)的讨论之后。但拉丁语注解家错误地将其理解为“超越于物理学的科学”,因而后来有了“元科学”、“元语言”等说法。——译者注
这样,哥德尔证明了,一个自洽的形式体系必定是不完全的,不可能存在完全且自洽的形式体系。
在会议的第三天,也就是最后一天,哥德尔在会上首次公开提出了他的发现,但没有引起什么反响。似乎只有一个人确实听了进去,这是个匈牙利人,叫做诺伊曼·亚诺什( Neumann J á nos)。这名年轻的数学家当时正在办理前往美国普林斯顿的手续,在那里他将很快改名为约翰·冯·诺伊曼。
工程师还发现了如何调制单股电流,以便把多股这样的电流整合起来通过单一信道进行传输,同时又不丢失每股电流的本来特征,这叫做多路复用。
由于需要频繁地拆接线,插头磨损得很快。对此,一个早期改进方案是采用一种约五厘米长的对折金属片作为插头。由于它像折叠刀( jackknife)的刀柄,所以这种插头很快也被叫作 jack,这种说法一直沿用至今。
这通常被视为世界上第一本电话号码簿,但它很难说得上是名副其实:
最早的一批电话接线员是十多岁的男孩子,是从电报送信员当中低薪挑选的。
《女性百科全书》( Every Woman' s Encyclopedia)就这样写道:“手臂的上下左右运动,会锻炼她的胸部和手臂,使得瘦弱的女孩变强壮。在接线室里,找不到看上去无精打采、病病歪歪的女性。”


第 8 章 信息转向(形成心智的基本要素)

大部分数学理论都是慢慢成形的,香农的信息论却如雅典娜一样,甫一问世便已成熟。
正如《爱丽丝镜中奇遇》里的红皇后所说的,我们只有全力奔跑,才能留在原地。[ 11]
英式的晚餐俱乐部(“有限会员制,活动主要在用餐后进行”,对于俱乐部名称和徽章、会员守则、聚会地点等也会有细致规定)。
他称之为“模仿博弈”,也就是后来鼎鼎有名的“图灵测试”。
这就是在心理学史上被称为认知革命的开始,一门结合了心理学、计算机科学和哲学的认知科学也由此发端。(gem: 认知心理学)
而比起预先编好程序的棋手,能自主学习的计算机棋手的问题恐怕要留待更远的将来来解决。

第 9 章 熵及其妖(你无法通过搅拌将果酱和布丁区分开来)

根据在贝尔实验室里流传的一个说法,是约翰·冯·诺伊曼建议香农使用这个词,因为没有人懂这个词的意思,所以他与人争论时可以无往而不利。[ 2]这件事虽然子虚乌有,但听起来似乎有点道理。

第 10 章 生命的编码(关于生物体的完整描述都已写在了卵里)

这封信其实原是这些科学家在瑞士洛迦诺的一次湖畔午餐上,酒酣耳熟之后的产物——原本
克里克当初是由于读了薛定谔的《生命是什么?》才从物理转而研究生物,所以他特意寄了份论文给薛定谔,但没有得到回音。
他指出,如果采取恰当的视角来看待生命,我们就会发现 DNA在历史上和在重要性上都是占先的。从这个视角来看,基因才是焦点,才是核心,才是主角。在他的第一本著作中(这是本大众通俗读物,出版于 1976年,起了个富有争议的书名,《自私的基因》)
塞缪尔·巴特勒在一百年前就说过(并且他并未宣称自己是第一个说这话的人),母鸡不过是一只蛋用来制造另一只蛋的工具。
“人类中心主义是人类智识的一大残疾”。
副本必须自洽且可靠,但无需完美。
道金斯所说:“自然选择偏爱那些与其他基因一起能胜出,同时反过来其他基因与它们一起也能胜出的基因。”

第 11 章 跃入模因池(它其实就是寄生在了我的大脑里)

这些图像也都是模因,它们有着自己的生命,独立于各种物质载体。
模因可以是故事、食谱、技能、传说或时尚等。我们在一个个人之间复制模因。不过,在道金斯的模因中心的视角看来,其实是模因在自我复制。一些
H. L.门肯就曾写道:“为理想而牺牲固然可贵,但为了正确的理想而牺牲,则更为可贵!”
后来英语中有了“ neither rhyme nor reason”的说法,表示不合逻辑,没有道理。——
在某种意义上,这种损人利己的模因也最有意思,比如相信自杀式炸弹袭击者能上天堂的思想。
而到了 1989年,在《自私的基因》第二版问世而他自己也成了一名熟练的计算机程序员
你说谁才是主人而谁又是奴隶?

第 12 章 认识随机性(僭越之罪)

一种更简单的理论,既可以解释大量已知的现象,也能预测尚未发生的事件。
通过与自己在莫斯科大学的学生合作,他为信息论引入了一套严格的数学表达,包括基本概念的定义、细致的证明和一些新发现——其中一些,他很快遗憾地发现,在香农的原论文里本来就有,只是在俄文译本中被删除了。
他得出了香农熵一个有用的一般公式,并扩展了香农的信息量度,使之可同时适用于离散时间和连续时间。
生成一个对象所需的最短计算机程序的长度,就是该对象的复杂度。
信息、随机性和复杂度,这三者本质上是等价的——三个威力强大的抽象,就像地下情人一般如胶似漆。
蔡廷此后一直在 IBM研究中心工作,可以说他属于最后一批受到企业倾力支持而其研究却对资助者没有直接实用价值的伟大科学家。
他的研究将数学视为某种经验科学,也就是说,数学不是借以抵达绝对真理的通道,而是实实在在的研究项目,受制于这个世界的偶然性和不确定性。
随机序列是“正规的”——这个用语表示,从长期的平均情况来看,每个数字都与其他数字一样常见,出现概率为十分之一
因为根据香农采样定理,离散化的波形是无损的
一如诗歌或其他任何艺术,优秀的音乐意在使人无法达到完美理解。倘若有音乐可以被直抵根底,那它势必是单调乏味的。
进化始于简单的初始条件,但慢慢地,复杂性自发地开始涌现。无论这其中涉及的物理的或生物的基础过程具体如何,它们实质上是增加逻辑深度的计算。

第 13 章 信息是物理的(万物源自比特)

约翰·阿奇博尔德·惠勒,核裂变的先驱、玻尔的学生、费曼的老师、黑洞的命名者、 20世纪物理学最后一位健在的巨人。(惠勒已于2008年去世)
诚如弗兰西斯·培根在 1625年所说:“在黑暗中,所有颜色看上去都一样。”
他甚至与霍金就此打了个赌,并引发了普遍关注。他赌信息一定以某种方式从黑洞中逃了出去,赌注则是一套百科全书,由获胜方来挑。斯坦福大学的伦纳德·萨斯坎德( Leonard Susskind)也站到了普雷斯基尔一边。(gem: Lenoard Susskind也是生活大爆炸中Leonard的名字来源,他的名字也常被翻译为苏世侃)
遗忘需要功。
本内特在 IBM研究中心办公室的墙脚摆放着一个像是嫁妆箱的设备,密不透光,人们称它为“玛莎阿姨”(其实全称是“玛莎阿姨的棺材”)。

第 14 章 洪流过后(一本宏大的巴别相册)

不过,就在巴贝奇出版该书的同一年,巴黎的艺术家兼化学家路易·达盖尔( Louis Daguerre)公开演示了经过自己完善的、利用银版捕获视觉图像的方法。
"维基"( wiki)一词源自夏威夷语,意为“快速”。
这个过程中常会出现所谓的编辑战,即对立阵营的贡献者不断地回退对方所作的编辑。 2006年底,就是该把养猫的人叫做猫的“主人”、“照料者”,还是“人类伴侣”,“猫”这一条目的编辑们争执不下。三周后,他们展开的长篇讨论都快够一本小书了。
根据当时相关国际标准委员会的决议,兆后面依次是吉( 109)、太( 1012)、拍( 1015)、艾( 1018)——它们都取自希腊语,只是后来几个的意味不免单调。这些
一千吉字节等于一太字节,这正是 1998年拉里·佩奇( Larry Page)和谢尔盖·布林( Sergey Brin)用三张信用卡凑出 15 000美元买到的硬盘的容量。当时

第 15 章 每天都有新消息(或者诸如此类)

各种形式的知识之所以能够臻于稳定和持久,并不是因为纸张比纸草更耐久,而只是因为现在副本为数众多。
但无疑也包含了一个无可否认的真理:在追求知识的过程中,慢反而好。徜徉在弥漫着旧书气味的图书馆内,在堆满了典籍的书架之间探索,自有其回报。阅读(哪怕只是浏览)一本旧书所能获得的养分是从一次数据库搜索中无从得到的。耐心是美德,饕餮是罪过,无疑也适用于此。
许多研究者发现,信息过量不仅会导致困惑和挫败感,还会导致视野受限和不诚实行为。
遗忘曾被视为一种失效、一种浪费以及一个老之将至的信号。而现在,遗忘是需要付出代价才能做到的事情。遗忘也许与记忆一样重要。
这是富足的窘境,无疑也再次提醒了我们,信息不是知识,知识不是智慧。
当信息变得廉价时,注意力就变得昂贵了。
再往前四个世纪,多明我会会士博韦的樊尚也曾尝试将当时已知的所有事物都纳入一本著作当中,从而创造出了中世纪最早的一批百科全书之一——《大宝鉴》,总共 80卷,共计 9885章。而他
一个有话想说却找不到听众的人是很不幸的,但更不幸的是那些找不到人有话想说给他们听的听众。”[

尾声 (意义的回归)

现在我们知道,真正造就大脑的并不是知识量,甚至也不是知识的分布,而是其中的互连通性。
信息社会中存在这样一个悖论:我们仿佛拥有了关于这个世界越来越多的信息,但这个世界在我们看来却越来越缺乏意义。[
那个地狱般的、未蒙上帝恩典的世界,已经变成现实了吗?信息过量但还要求更多,哈哈镜和虚假文本大行其道,充满污言秽语的博客、隐藏在匿名背后的自以为是、毫无新意的讯息举目皆是?到处喋喋不休,最终虚假驱逐真实?所幸我现在看到的世界并非如此。
群体很容易变身为群氓,而且其种种表现形式可谓历史悠久:热潮、泡沫、私刑暴民、快闪族、神圣战争、集体歇斯底里、羊群心理、整齐行动、从众心态、团体迷思,等等——而现在,这些效应可能会被网络效应进一步放大,并可以从信息级联的新角度进行研究。
约翰·瓜尔 1990年的戏剧《六度分隔》中
一直以来,是选择塑造了我们。选出真正的信息需要做功,而后遗忘它们也需要做功。这是伴随全知全能而来的诅咒:借助 Google、维基百科、 IMDb、 YouTube、 Epicurious(菜谱网站)、全美 DNA数据库或这些服务的模仿者和继承者,任何问题的答案似乎触手可及,但同时我们依然不确定自己到底知道些什么。
那种自我沉醉、自以为乐的散文与诗歌杂糅的文风,正是法国精神的拙劣体现。”

目录

是作为暗喻的回声,是作为信息的游戏