您当前的位置:首页 > 美文分享

图书扫描(谷歌的图书扫描计划为何失败)

时间:2022-04-05 14:29:14

图书扫描(谷歌的图书扫描计划为何失败)

你离读到迄今为止出版过的所有书的电子版只有一步之遥。如果你想读的是那些还没出版的书,可能还是需要付一些钱,但是其他所有已经出版的书,都可能可以在每个地方图书馆里的阅读终端上免费阅读。这个电子书库的馆藏会比美国国会图书馆、哈佛大学、密歇根大学和欧洲任何一个国家的国家图书馆的馆藏都要大。

美国国会图书馆

在每个图书馆都即将会拥有的阅读终端上,你能搜索千万本的图书,并且阅读你能找到的图书的每一页。你可以高亮段落,做注释和分享。人们还能第一次自由地在所有已经印刷出来的图书中定位一个观点之后直接把链接发给别人。很快图书也能像网页一样可以在眨眼之间获取、搜索和复制粘贴。

这曾是一个即将实现的夙愿。牛津大学博德利图书馆的馆长理查德·欧文顿(Richard Ovenden)说,“千年以来一直有人在梦想一个世界级的图书馆,文艺复兴的时候,就有人在幻想我们可以把当时世界上所有已经印刷在纸上的知识全部储藏在一个房间或者一家机构里。”在2011年春天的时候,我们已经做到把世界上所有的书籍都储藏在一个能够放在桌面上的小小终端里。

2003年,美国国会图书馆的管理员(左)与2013年, 美国罗利,北卡罗来纳州立大学发明的图书自助检索系统。

当时有一位热切关注此事的人这么写道:“这是一个里程碑式的事件,它可以推动教育、研究和人们的智性生活的革新。”

但是,在那一年的3月22日,美国纽约南区地方法院依据联邦民事诉讼规则的第23(e)(2)条款否定了这一项准备向世人开放这一个世纪以来出版的所有图书,并且在所有图书馆安装图书阅读终端的计划。

当亚历山大图书馆惨遭火灾的时候,人们说这是“全世界的灾难”。而那一年,当我们这个时代最重要的人文计划被法院否决的时候,那些帮助阻止这一计划的学者、档案学家和图书馆员都松了一口气,因为他们觉得他们恰恰是阻止了一个灾难的发生。

谷歌决定扫描世界上所有图书的秘密计划开始于2002年,该项目的名字叫做“海洋计划”(Project Ocean)。当时拉里·佩吉(Larry Page)和玛丽莎·梅尔(Marissa Mayer)正坐在办公室,手边放着一本三百页的书和一个节拍器。佩吉想知道如果要扫描一亿本书需要花多长时间,所以他就从他手边的这本开始试起。他和梅尔两个人用计时器来保证速度,然后花了40分钟时间把这本书从头到尾一页一页地翻了一遍。

佩吉一直想实现图书的数字化。早在1996年,当Google还只是一个学生项目,主要用来通过爬虫分析文件并且根据用户的请求进行相关度排名的时候,当时Google背后的设想就是要“发展技术,建立一个统一的世界数字图书馆。”当时的想法是,在未来图书都实现电子化的时候,人们就能够勾勒出每一本书的引用网络,看看哪本书被引用的频率最高,然后利用这些数据给图书馆的使用者提供更好的搜索结果。但是纸仍然是大多数书籍的载体。佩吉和他的研究伙伴谢尔盖·布林(Sergey Brin)一起利用万维网中的网页进行试验,继续充实他们根据引用量来判断受欢迎程度的点子。

到2002年的时候,佩吉觉得重新关注书籍的时机已经成熟。在他头脑中有了“40分钟”这个大致概念的时候,他回到了他的母校,在图书扫描领域领先世界的密歇根大学,想看看批量数字化技术发展到了什么程度。密歇根大学告诉佩吉,按照当时的速度,如果想把密歇根大学700万册的馆藏全部数字化,需要大概一千年。如果是现在的佩吉,可能还会稍微迟疑一下,但是当时的佩吉回答说,谷歌只需要六年左右。

密歇根大学图书馆

他给密歇根大学图书馆提议:图书馆将所有的书借给谷歌,谷歌来替对方完成全部的扫描。最后你能得到你的全部馆藏的电子版,而谷歌将获得海量的还不曾被人问津的数据资源。布林如此描述谷歌对图书馆藏的渴望,“人类的知识有几千年的历史,而书籍中承载的可能是其中质量最高的部分。”试想如果所有被尘封在纸页间的知识能够进入搜索引擎?

早在2004年之前,谷歌就开始了扫描工作。之后,谷歌和密歇根大学、哈佛、斯坦福、牛津、纽约公共图书馆和许多其他图书馆系统都订立了合约,并且以超过佩吉预言的速度,在十年多一点的时间里扫描了大约2500万册图书。图书扫描工作花掉了谷歌大约4亿美元。这项工作不仅仅依靠技术,还依靠强大的物流支持。

从周一到周五,装满图书的半挂卡车都会停在谷歌扫描中心的门口。负责扫描斯坦福图书馆藏书的中心是一个改造的办公大楼,位于谷歌的山景园区(Mountain View campus)。图书从卡车上卸下来之后会放在图书馆里常见的那种小推车里,然后被推给人工操作员。扫描中心大约有几十台扫描仪,一行一行地整齐排列,台与台之间间隔2米左右,操作员就坐在明亮的扫描仪前工作。

这些扫描仪是谷歌定制的,它们与其说是扫描,还不如说是给书拍照。每台仪器一小时可以数字化1000页左右的图书。待扫描的书会被放在一个特别设计的自动支架上,支架可以适应不同的书脊,并且将图书固定。仪器上方有一排灯,还有价值至少1000美元的光学器材,包括四个摄像头,两个分别照着摊开的书的左右两半,还有一个负责确定扫描范围的光学雷达,它会在图书表面生成一层激光网格,从而捕捉到纸页的曲度。操作员负责手动翻页,因为也没有机器能比得上人手的快捷和轻柔了,然后脚踩踏板来触发相机进行拍照,一系列动作仿佛是在弹一架奇怪的钢琴。

这个扫描系统很高效的原因是软件完成了大部分工作。在传统的图书扫描系统里,在每次拍照之前确保每一页都是放正、铺展的是拖慢扫描进度的主要原因,而在谷歌的扫描系统中,每页歪歪扭扭的图书的照片会经过一个“去皱算法”的处理,该算法利用光学雷达的数据,最终使得书中每行文字回到正常的、看起来横平竖直的高度。

该项目的巅峰时期曾雇佣了大约50个全职工程师。他们负责研发能把图像转化为文字的光学识别软件,写去皱、颜色校正和对比度调节的算法,以便更好地处理图像,他们还研发了识别书中插图和图表的算法、提取页码的算法、把脚注转换为引用的算法、甚至还有按照布林和佩吉早期研究的思路,把图书按照相关度排序的算法。丹·克兰西(Dan Clancy)曾在该项目鼎盛时期担任工程主管,他说,“书与书之间还没有形成网络。一个巨大的研究挑战就是理解书与书之间的关系。”

在当时谷歌公司的其他部门都痴迷于让各种app更社交化,比如在2011年发布的Google Plus,而负责图书项目的人则将书籍扫描看作是像谷歌的搜索服务一样老派传统的东西,它们都呼应了谷歌公司的使命:“让全世界的信息有序,并且跨越国界地流通和发挥作用。”

图书扫描项目是有史以来第一个被谷歌称作“探月”(moonshot)的项目。在谷歌开发无人汽车和通过高海拔气球向非洲输送互联网的“疯狂气球计划”(Project Loon)之前,这个数字化图书的计划被外界认为是一个白日梦。甚至有些谷歌的员工也认为这个项目纯粹是在浪费时间和金钱。克兰西告诉我,“当时在我们做这个谷歌图书搜索项目的时候,谷歌内部肯定有不少人想:‘为什么我们要在这个项目上投入这么多钱?’一旦谷歌开始稍微精打细算起来,就会有人质疑,‘等等,你每年有4000万美元可以花,然后你居然砸了5000万美元在图书扫描上?然后这个项目总共要花掉我们3到4亿美元?你在想什么呢?’不过拉里和谢尔盖一直忠实地支持这个项目。”

在2010年8月,谷歌在博客上发了一条消息,说全世界总共有129864880册图书,而谷歌要把它们全部扫描完。

当然啦,事情后来的发展并不完全像他们说的那样,这个探月项目大概比原计划少扫描了1亿本书。计划失败的整个经过很复杂,但是起因却很简单:谷歌做的这件事被认为是错的,而没有人愿意宽恕。在得知谷歌从图书馆中拿走了百万册的图书,一本一本地扫描完毕,还像没事人一样地把书还了回去之后,各路作家和出版商开始起诉谷歌,正如他们在一开始的抗议中写道的,指控谷歌“大规模侵犯知识产权”。

可以自动翻页的图书扫描仪

谷歌扫描图书的初衷不是为了建一个数字图书馆,让大家能够完整地阅读电子书,这个点子是后来才有的。他们一开始的目标只是为了让用户能检索图书,对于那些有版权的书,谷歌只能显示图书的片段,搜索结果中只能显示你搜索到的条目前后的几句话。因此谷歌把他们的图书搜索服务比喻成一个卡片式的索引目录。

谷歌还以为建立一个卡片式的索引目录是属于“合理使用”的范畴,就像版权法允许学者可以引用别人的作品一样。谷歌公司的律师大卫·杜蒙德(David Drummond)说,“合理使用和不合理使用的区别在于是否有对原文的改变。没错,我们在数字化图书的过程中是制作了一个副本,但是很显然,让用户能够在书中找到某个术语不等于让用户读了这本书。这也是为什么谷歌图书提供的服务和图书本身不一样。”

杜蒙德必须得是对的,因为依照法律,故意侵犯支持产权的赔偿金额是15万美元/每本书。如果谷歌真的侵犯了千万册图书的知识产权,那么它需要赔偿的数额将以万亿计。美国加州大学伯克利分校的法学教授帕梅拉·塞缪尔逊(Pamela Sameulson)在2011年写道:“谷歌的确有理由害怕他们是在孤注一掷地赌自己的行为是对知识产权的‘合理使用’。”知识版权的拥有者们反扑了回去。

他们反扑的理由很充分。因为谷歌在没有任何许可的情况下就洗劫了图书馆。这显然是错误的。如果你想要复印一本书,首先你要有复印的权利(the right to copy it)——也就是作者和出版商老爷们才有的“版权”(the damn copyright)。如果放任谷歌成批成批地复印美国所有的图书,对版权拥有者们无疑遗患无穷,这种行为说不定会导致他们失去“知识产权”本应给他们带来的利益。“美国作家协会”和几位作家代表全美所有的图书版权受益者对谷歌提起了集体诉讼(有一些出版商已经单独起诉了谷歌,但是之后很快就加入了美国作协的集体诉讼)。

科技公司蔑视知识产权已经有很长的历史了,因为它们发明了新的分发内容的方式。在20世纪初期,制造了自动钢琴上的打洞纸卷(piano rolls)的人无视了乐谱的知识产权,后来遭到了音乐出版商的起诉。同样的事也发生在了唱片制造商和早期的商业收音机供应商的身上。在上世纪60年代,有线电视在没有授权的情况下转播了无线电视的信号,随即面临着高额的诉讼。电影制作公司起诉录像机制造商,音乐公司起诉了在线音乐共享服务KazaA和Napster。

正如蒂姆·吴(Tim Wu)在2003年一篇法律评论文章中指出的,发生在自动钢琴的打洞纸卷、唱片、广播和有线电视身上的事,并不是版权拥有者要打压新技术。相反,他们要求从新技术中分一杯羹。通常的做法是颁发版权许可,比如音乐家必须要把他们的作品授权给打洞纸卷制造商,作为交换,制造商要为他们制作的不同歌曲的纸卷支付一笔固定数额的费用,比如一首歌两分钱。音乐家因此拥有了一个新的收入来源,公众也能在自动钢琴上听到他们喜欢的歌曲。吴写道:“历史表明,时间和市场经济总是能保证利益博弈的平衡。”

但是尽管每一方都获得了好处,每次博弈版权方都会害怕他们会被新技术取代。当录像带出现的时候,电影制作人强烈抗议。当时美国电影协会的主席杰克·瓦伦提(Jack Valenti)在法庭上陈词:“我告诉你们,对美国的电影制片人和美国公众来说,录像机比在波士顿地区杀死了13名妇女的杀人犯对独自在家的妇女的威胁还要大。”大的电影制作公司起诉了索尼,认为它们的录像带生意完全是对知识产权的剽窃。但是美国索尼公司对环球影业制片厂的案子之所以为人所知,是因为它判定只要复制技术依然有从事“非侵权”活动的可能性,比如人们可以用在家里看电影,所以录像机的制造者并不承担侵犯知识产权的责任。

索尼的案件迫使电影行业接受了录像机的存在。不久之后,他们开始把录像机看成是一次契机。2000年的时候一个评论员这么说:“录像机后来成为了继电影放映机之后对电影制片人和硬件生产商来说最有利可图的发明。”

所有起诉谷歌的作家和出版商只花了几年时间就意识到,事实上还是存在一个让各方都满意的解决方案的,尤其是当你开始把注意力转向一些已经绝版而不是还在销售的图书的时候。如果你发现了这个区别,你就会以不同的眼光来看待谷歌的整个项目。或许谷歌并没有掠夺任何人的劳动成果,他们只是使旧书重获新生。谷歌图书之于绝版书籍就像录影机之于已经下线的电影。

谷歌图书

如果真是这样,人们反而不想去阻止谷歌扫描绝版书籍了,而甚至想鼓励这种行为。事实上,人们可能会希望不仅仅是只能搜索到图书的片段,而是希望谷歌能够出售这些绝版图书的电子版。因为从本质上来说绝版图书已经在商业上无利可图,如果谷歌能通过大批量数字化为它们找到一个新的市场,这对于作者和出版商来说可能还是一种胜利。时任美国出版商协会主席的理查德·萨诺夫(Richard Sarnoff)在当时说道:“我们意识到现在有一个机会,可以对美国的读者和学者做一件很有意义的事。我们意识到我们可以重新发现和消费图书行业里已经绝版的图书。”

然而一旦你有了这个想法,谷歌到底能不能进行图书扫描并且在搜索结果中展示章节片段的起诉似乎已经不重要了。如果作家协会一方赢了,他们除了法定的损失费之外并不能得到别的补偿,而且阻止谷歌向用户提供一些旧书的章节对他们又有什么好处呢?说不定那些章节片段还会促使用户去买书。如果谷歌赢了:作家和出版商什么也得不到,所有的读者则能得到绝版图书的片段,但他们得不到全文。

原告已经使自己陷入了一个特殊的境地。他们既不想输掉起诉,但也没有赢的动力。

关于绝版图书的最根本问题是它们的所有权并不明晰。作家可能在40年前和出版商签了合同,合同规定在图书绝版之后权利又会回到作者的手里,但是合同要求作者发布一个声明宣布版权的回归,而且合同中也没有提到数字图书版权的问题,而且所有的这些都记录在几张根本不知道在谁那里的纸上。

据统计,1923年到1963年期间出版的大约半数图书事实上都已经进入了公共领域,只是没有人知道具体是哪些书。那时候生效的版权需要被更新,但是大多数情况下版权所有者懒得去再走一遍合同程序,即使他们更新了版权协议,合同可能也已经丢了。因此,弄清楚某本书的版权到底归谁成了一件成本很高的事,甚至超过了这本书的市场价值。萨诺夫说:“要让人们去弄清楚每一本书的归宿,不光是一件如西西弗斯推石头一样徒劳的事,从经济成本上来说它是没有可行性的。”所以大部分绝版的图书哪怕版权没有问题,也会因为太麻烦而被尘封。

在美国作协对谷歌公司的案件中,人们意识到了上述问题有可能能被彻底避免,并且这推动了一项协议的诞生。美国作协的诉讼案是一项集体诉讼案件,这个集体包括美国所有的图书版权拥有者。在集体诉讼行动中,原告是在代表整个集体提起法律诉讼(虽然任何人都有权利退出)。

作家协会一案的解决方案之一是为图书馆里所有的书都找到它作家和出版社的归属。不过,你也可以与所有作家订立一个集体协议:作家全体同意谷歌对他们的著作进行扫描并且可以在搜索结果中显示,条件是与谷歌共同分享销售这些书的收益。

德普律师事务所的杰夫·库纳德(Jeff Cunard)在案件中代表出版商一方,他这么说道,“集体诉讼机制可以解决体制性的问题,因为集体诉讼放弃了先前的各种起诉,并且致力于找到一个面向未来的解决方案。在本案中,有些人将此看做是一个解决绝版图书问题并将它们从尘封状态中解救出来的契机,我认为这非常明智。”

这个想法真是太妙了。如果你能让作家集体同意你的解决方案,并且能说服法官通过(这一步是必要的法律程序,因为要确保集体代表是在以最大化集体利益的方式行动),那你就可以快刀斩掉旧书所有权的乱麻。在集体诉讼案解决之后,所有属于该集体的作者和出版商都必须得赞成谷歌的扫描计划。

不过,很自然的,你必须要给作者和出版商一些好处。这也是这个案件最妙的地方。此案解决方案的核心在于要给绝版图书进行授权。作者和出版商可以随时带着他们的书退出这个协议,但是对于那些没有退出的,谷歌将拥有展示和销售这些书的自由,但是作为回报,63%的收入将交由一个新成立的第三方机构“图书版权登记处”(Book Rights Registry)保管。登记处的职责是在那些作者上门来认领某些图书的版权的时候给他们分一笔钱;对于版权并不明晰的书,一部分的基金会用来追踪书的版权归属。

库纳德说:“图书出版业并不是世界上最完善的产业,作者作为独立个体也不能从绝版书中获得利益。也不是说现在他们就要从谷歌图书和版权登记处那里大捞一笔,只是说他们至少不是一无所得。而且,说实话大多数的作者是希望他们的作品是会有人去看的。”

这个被称为《谷歌图书搜索修正协议》(Google Books Search Amended Settlement Agreement)的文件有十几条附录,共计165页。确定各项细节前前后后花了两年半时间。萨诺夫将谈判过程比作一个在作者、出版商、图书馆和谷歌公司之间进行的“四维象棋”。“每个谈判参与者,真的是每个人,当时都觉得如果我们真的把这事儿谈成了,那就是每个人在自己的事业里最大的成就。”最终,协议要求谷歌支付1亿2500万美元,其中包括一次性支付给它已经扫描过的图书的版权方的4500万美元(大约按每本书60美元计算),分别向出版商和作者支付的1550万美元和3000万美元诉讼费,以及用来创立图书版权登记处的3450万美元。

这项协议中也规定了到底应该如何展示和出售这些重获新生的绝版图书。按照协议,谷歌可以展示该书至多20%的部分来诱使用户购买,谷歌可以出售可下载的电子版,价格则由算法或者版权所有者来确定,由1.99美元到29.99美元不等。所有绝版书都会被打包存进一个“机构订阅数据库”,大学可以买下这个数据库,供全校师生免费搜索和阅读里面的全部书籍。协议的§4.8(a)项条款还用法律语言干巴巴地宣布一项无与伦比的公共事业即将开始:美国所有的地方图书馆都会建造阅读终端,向公众开放该数据库的资源。

年复一年的起诉和谈判终于敲定了所有的细节。但是到了2011年的时候,终于出炉了一项看起来是共赢的计划,正如伯克利的法学教授塞缪尔逊在当时说的,“这个解决方案像是一个三赢——图书馆可以得到成千上万的图书,谷歌在图书搜索服务上的投资没有白费,作者和出版商能够从已经毫无商业价值的书中获得一笔新的收入来源。法律没有必要否定这样一个圆满的结果。”

因此,她写道:“这可能是有史以来最有冒险精神的一个集体诉讼案。”但是按照她的思路,这也是为什么这个方案最终会失败。

《谷歌图书搜索修正协议》的公布在当时上了头条新闻。它真的是一件大事,大到足以撼动整个图书出版行业。作家、出版商、谷歌的竞争对手、法律学者、图书馆员、美国政府还有感兴趣的公众都在热切关注案件的每一部进展。当首席法官丹尼·秦(Denny Chin)向公众征集对此解决方案的意见时,回复如雪片般飞来。

参与这项协议的人们预感到可能会有一些反对意见,但没想到迎接他们的是,用萨诺夫的话来说,“极端的反对和恐慌”(parade of horribles)[译注:即通过列举某项行为可能会引发的所有极端负面后果来反对该行为],声称这项协议会产生无可估量的负面影响。反对意见各不相同,但是它们都仿佛感觉到这项协议会让且仅让谷歌获得极大的权力。时任哈佛图书馆馆长的罗伯特·达恩顿(Robert Darnton)说:“难道我们想把最伟大的图书馆交给一个想向我们收多少钱就收多少钱的大公司吗?”

其实达恩顿一开始是支持谷歌的图书扫描计划的,但是这个解决协议让他开始焦虑了。他和很多其他人一样都在担心,发生在学术期刊市场上的事会在谷歌图书的数据库上重演。在一开始价格可能是合理的,然而一旦图书馆和学校对订购谷歌的数据库产生了依赖,订购价格就会开始像高利贷一样暴涨,最终涨得和各种学术期刊一样高。拿2011年为例,订阅《比较神经学刊》的年费高达25910美元。

尽管学者和图书馆爱好者对于开放所有绝版图书的前景非常向往,他们却将那份解决协议看作是与魔鬼的契约。没错,最终建成的的确是一个有史以来最大的图书馆,但很有可能同时也是一个被巨型垄断公司控制的有史以来最大的图书超市。在他们看来,这并不是最好的解决绝版图书问题的办法。伯克利的法学教授帕梅拉·塞缪尔逊写道:“没错,这项协议的大部分看起来都会造福公众,但它却将这项交易的全部好处都划给了谷歌。”

谷歌的竞争对手也觉得受到了这份协议的威胁。微软公司就不出所料地声称,如果谷歌是唯一一个可以合法地检索绝版图书的搜索引擎,这无疑会强化谷歌在全世界作为搜索引擎霸主的地位。如果谷歌利用这些绝版图书来满足用户的长尾需求,这将是一个对于其他公司来说很不公平的竞争优势。谷歌的回复很简单:你有本事你也可以去扫描图书然后在搜索结果中显示,所以谷歌这样做没什么不公平的。(实际上在今年早些时候,第二巡回法庭终于裁定认为谷歌的扫描图书并在搜索结果中显示片段的行为的确属于合理使用。)

针对谷歌拥有海量藏书这件事,克兰西说:“确实有这样一个假说,就是谷歌会拥有巨大的竞争优势。”但是他说这项数据从来不在谷歌公司的任何一项计划中占据核心位置,因为这些书的数据量跟互联网上现有的数据总量比起来真的是沧海一粟。他说:“你根本不需要在一本书中查伍德罗·威尔逊(Woodrow Wilson)是什么时候出生的。”图书的数据是有用的,对研究者也很有吸引力,但是“反对者夸大了这些图书数据对于谷歌整个项目的战略性作用,这是没有道理的”。

亚马逊公司则担心这项协议会让谷歌建立一个无可匹敌的图书商店。亚马逊认为,任何想要出售绝版图书的人,都必须要一本一本地确认图书版权,这是最好的,但是集体诉讼的协议却让谷歌一次性获得了所有图书的授权。

这项反对吸引了司法部,尤其是反垄断部门的注意,他们开始介入此项协议的调查。在一项递交给法院的声明中,司法部认为该协议实际上是给了谷歌对绝版图书的垄断权。因为如果谷歌的竞争者也想像谷歌一样得到这些书的扫描和展示权,他们就得经历同样诡异的步骤:批量扫描,遭到起诉,像谷歌一样协商解决。司法部写道:“哪怕我们认为历史有那么一点点可能会重演,我们也不应该鼓励这种先故意侵犯版权,然后再通过诉讼解决的做法。”

对谷歌最好的辩护论点就是反垄断法是用来保护消费者的。正如谷歌的一位律师所说:“从消费者的角度来说,能够得到一件商品无论如何是比根本无法得到要好的。”绝版图书完全是无法从网上获得的,现在谷歌给消费者提供了一条路。这怎么会伤害消费者呢?一位深度参与协议协商的人告诉我:“每个出版商都去和反垄断部门说,你看亚马逊可是占了电子书市场的80%呢,谷歌占的比重大概是0%到1%。所以这其实是允许一个公司在电子书市场和亚马逊竞争呀。所以你们应该把谷歌的这件事看做是一件支持自由市场竞争、而不是垄断的事。我也觉得他们说的很有道理,但是他们对反垄断部就像对牛弹琴,最后的回应是非常令人遗憾的。”

司法部没有让步。从某种程度来说,协议的各方没有什么好的解决办法:不管他们多想让这个协议看起来不是排他的,但因为谷歌是此案唯一一个被告,所以事实上只有谷歌一人得利。但是如果要让这个叫做“作家协会诉谷歌”的案子把除了谷歌之外的所有想贩卖电子书的公司都包括进来,就会超过这一集体诉讼案的承载能力。

这也是司法部门不停地强调的一点。司法部认为,这个协议已经是超过该案原本的范畴了,本来的案子是关于谷歌有没有展示它所扫描的图书片段的权力,而现在这个解决协议却在说要建立一个线上图书市场。这个线上图书市场的建立应该要获得作者和出版商的永久授权,但问题你很难把每本书和它的作者和出版商对号入座,尤其是绝版书的。司法部写道:“这项协议想利用集体诉讼机制来对未来进行商业部署,但是这已经远超出本案原本的范畴了。”

司法部的反对导致这个协议进退两难:如果这个协议只针对谷歌,就会被认为是支持垄断;如果想扩大协议对象,又会被指控为超过了集体诉讼的范围。

参与商讨这项协议的律师们想努力寻找一个中间地带。司法部也看到了他们的努力,因此这样写道:“美国官方已经察觉到了参与《修正协议》的各方在试图利用集体诉讼机制来克服在建立一个丰富、有活力的电子书市场时遇到的法律和结构性的挑战。虽然他们的目标很有价值,但是很遗憾,美国政府依然认为该协议是对集体诉讼机制的滥用。”

司法部的论点也很令人信服,但是这个协议有一个野心勃勃的目标并不等于说它是不合法的,只不过是没有先例罢了。多年以后,另一个和此案非常相似的集体诉讼案协议却得到了一个地方法院的批准,只不过后者的协议说明了该协议是一个可退出的、“面向未来的商业部署”。这个新的诉讼案是关于已经退役的全国橄榄球联盟的运动员的形象权,最后的解决协议将所有肖像权都归给了一个组织,该组织有权授权使用这些运动员的肖像权并且确定收益分成。同样也参与了这个诉讼案的库纳德说:“此案的有趣之处在于,没有任何一个反对者提过谷歌一案中导致秦法官反对的理由,或者提到任何此解决协议‘超过了诉讼范围’这一点。”库纳德表示,如果这个形象权的案件发生在十年之前,它将会成为一个“非常重要和实质性的先例,那么关于《修正协议》‘超出集体诉讼范围’的这条反对理由就会站不住脚了。这其实说明了法律是一个非常易变的东西。总是要有第一个吃螃蟹的人。”

最后,很有可能是司法部门的介入导致协议无果而终。没有人知道为什么司法部要反对而不是保持中立。参与协议商定的谷歌图书扫描项目工程师丹·克兰西认为,最终说服司法部表明立场的并不是谷歌的竞争对手,而是那些你本来以为会站在你这边的旁观者,比如图书馆爱好者、学术作者这一类人。克兰西对我说:“我不知道如果那些反对者的声音没有这么大的话,这个案件的解决会有什么不同。我不清楚如果那些图书馆和那些像罗伯特·达恩顿或者帕姆·塞缪尔逊一样的人没有那么积极地采取行动的话,司法部到底会不会介入,因为如果没有这些人的话,那么就只会剩下亚马逊和微软在对谷歌发牢骚,而这人们已经见怪不怪了。”

不管是什么原因,司法部把想说的话都说了,并且吸引了公众的注意。法官丹尼·秦最终依据集体诉讼法规裁定《修正协议》“不公平、不充分、无据可依”,并引用了司法部的反对理由,建议将协议修改为一项自愿加入的协议(虽然这样会让这项协议签了也等于白签),或者就是直接去说服国会。

秦在他的决定中写道:“尽管图书的电子化和建立一个无国界的图书馆可以让很多人收益,但是这个《修正协议》太过了。”

在讨论《修正协议》的公平听证会的尾声,秦法官仿佛是单纯出于好奇地问了一句,现在有多少个反对意见?又有多少人选择退出这个集体诉讼中的集体?结果分别是500多个和6800多人。

FBI Warning:侵权会有严重的法律后果。

反对《修正协议》也没什么不合理的。双方都很有道理,没有人知道秦法官最后会倾向哪边。最后导致这个协议被否决的是集体诉讼中的作家和出版社集体的反对行为本身。代表作家集体的主要谈判人迈克尔·伯尼(Michael Boni)说:“在我参与各种集体诉讼案的25年以来,我从来没有见过哪个解决协议有这么多的反对者。”作家集体的强烈反对很有可能也是导致司法部介入的原因,是导致公众也开始反对《修正协议》的原因,并且是导致秦法官开始寻找否决这项协议的办法的原因。毕竟,对法官来说最关键的问题是这项协议对诉讼集体的成员来说是否公平。站出来对协议表示不满的诉讼集体成员越多,法官越有理由相信这项协议不符合他们的利益。

讽刺之处在于许多反对这项协议的人从心底里是信任谷歌的这项计划的。帕梅拉·塞缪尔逊反对的主要原因是谷歌会“出售”她的书和别人的同类作品,而她觉得这些书应该向公众免费开放。(她和其他受到协议约束的作者一样,并不仅仅满足于只把自己的作品免费开放,因为那些找不到作者的“孤儿作品”仍然会被标价出售。)我们今天再回头审视这件事的时候,我们会发现它的逻辑很吊诡:如果找不到一个完美的解决方案的话,不如放弃解决这个问题。哪怕最后谷歌标价出售那些孤儿作品,但是让所有的书都能被公众以某种方式获得总比让公众什么都看不到好吧。在她的论文中,她虽然得出结论认为《修正协议》太过了,但她仍然写道:“这个(开放电子图书资源的)美好愿景不能变为现实真是太令人难过了,因为现在看来它是如此的近在咫尺。”

事实上很多反对者相信此事会有一个比集体诉讼协议更好的解决方案。在公平听证会上反复出现的一句话是说国会应该有授权数字化绝版作品的权利。当这项协议被否决的时候,他们指出,美国版权办公室建议通过立法来规范类似行为的提案还有北欧国家在开放绝版图书方面的努力实际上都印证了国会应该负责授权的观点是对的,国会能够做到这项协议做不到的地方。

当然了,在差不多十年之后,国会并没有采取行动。库纳德讲了版权办公室的提案:“这件事没有进展,我也不觉得它现在会有什么进展。”那些支持《修正协议》的人都说那些反对者的想法很不现实,他们好像都不懂社会到底是怎么运转的。“他们觉得如果我们这次诉讼不能解决图书问题,未来还会有机会的,因为国会可能会立法什么的。然后……但是这件事一尘埃落定,就再也没有半个人关心它了。”克兰西说。

很显然,没有谁愿意在改变图书的授权规则上花费政治资本,尤其是在今天,更何况是那些已经过时的书。克兰西说:“对国会来说,改变版权法并不重要,这件事既不会让谁赢得选举,也不能创造大量就业岗位。”所以也无怪关于谷歌的集体诉讼案可能会是推动此方面改革的唯一契机:因为谷歌是唯一有动力的一方,而且也有财力让它实现。出版商的内部法律顾问阿兰·阿德勒说:“这件事说白了,就是一个私人公司要替一个人人都想要的东西买单,就是这么简单。”谷歌向这个项目倾注巨资,不单纯只是想扫描,也是希望挖掘和数字化旧的知识产权资源,希望能和作者与出版商谈判,希望能出钱建立一个图书版权登记处。多年之后,版权办公室除了提出了一个不仅毫无新意还需要国会拨款的提案之外没有任何进展。

在谷歌图书诉讼案期间时任哈佛图书馆馆长的罗伯特·达恩顿,他当时反对《修正协议》,当被问是否后悔最后的结果,“如果说我后悔的话,一切其他试图绕过谷歌的方法其实也都深受版权法的限制。”达恩顿在开展另一项图书馆图书扫描项目,但是他只能够扫描那些版权已经进入公有领域的书。“别会错我的意思,我很支持版权,但是说实话,要等一百多年才能等到图书进入公有领域,而且美国大多数的图书馆也都被拦在了版权的门槛之外,我觉得不可思议。”

在1790年通过的美国第一个版权章程叫做《一项鼓励学习的法案》(An Act for the Encouragement of Learning)。当时版权的期限为14年,如果作者在第一期版权结束时还健在,可以选择再延长14年。当时的想法是要在作者和阅读公众之间取得一个合理的平衡。作者可以有限地垄断他们的作品并以此谋生,但是他们的作品也会很快进入公共领域。

在欧洲,版权的期限是作者的寿命再加50年。为了和欧洲保持一致,美国的版权期限也快速提高。但是欧洲“依据的是自然法而不是实在法”,霍华德大学法学院的版权研究学者拉蒂夫·穆提玛(Lateef Mtima)说:“他们的思维方式源于法国,源于雨果,他们那些人的想法是‘我的作品就是我的孩子’,国家没有权利对我的作品做任何事,这有点像洛克的观点。”在全球化的进程中,版权法律也相互融合,大家都怕如果一个国家先开放了自己的知识产权之后就会被别的国家利用,从而处于劣势。所以把版权当做一个“传播科学进步和实用艺术”工具的美国法律就渐渐转变成一个把1923年之后出版的几乎所有书都禁锢起来以保护作者的版权法律体系。

穆提玛说:“在孤儿作品的问题上我们还在原地踏步,这是最大的悲剧。除了少数例外,大部分孤儿作品现在就只是在不知道哪个角落积灰和腐烂。没有人有权利用它们,所有人都输了,没有人是赢家。”

在《修正协议》失败之后,谷歌也“逐渐泄气”。尽管谷歌赢了作协诉谷歌一案,法庭也宣布谷歌可以展示图书的章节片段,公司也几乎停止了它的图书扫描项目。

一想到谷歌公司的某处有一个包含有2500万本书但是却没有人有权利阅读的数据库,这个事实就让人觉得无法理解。这就好像是《夺宝奇兵》第一部的结尾那里,他们把珍贵的法柜放到了架子上的某个地方,然后就湮没在了一个巨大、混乱的仓库里。但它就在那里。那些书就在那里。多少年来,人们都梦想着建造一个这样的图书馆,一旦成功,他们说这将会是有史以来最大的人文主义成就。现在我们付出了努力将它变成了现实,距离将它献给全世界只有一步之遥——但是现在,它仅仅是硬盘上一个50或者60PB大小的文件,除了几个负责把它们锁起来的工程师之外没有人能看到。

如果想把那些书全部开放给公众需要做些什么?开放这些资源有多困难,到底是什么拦在了我们和一个藏有2500万本书的数字图书馆之间?

一个曾任该工程工程师职位的人说,你会惹上很多麻烦的,但是从技术上来说只需要写一个简单的数据库查询。你需要把某些off按钮点成on,当然等这个指令执行完毕可能还要几分钟。

本文编译自《大西洋月刊》2017年4月20日Torching the Modern-Day Library of Alexandria一文。

图书 协议 扫描 版权 司法部

最新文章