2007年4月15日星期日

小结Google 拼音输入法盗用词库事件

4月4日,Google 拼音输入法打破以往Google 中国低调发布本地化产品的风格,在前一天“泄漏”的铺天盖地的小道消息中高调推出,欲把此作为Google 中国的主打本地化产品。但发布当天即被爆出Google 拼音输入法盗窃搜狗拼音输入法的词库。随后此事在网络上引发轩然大波,众多Blogger都参与到了这次Google 拼音输入法盗用词库事件的讨论中。

4月6日,Google 拼音输入法更新到1.0.16.0版本,将搜狗拼音输入法的词库指纹删除,但仍保留众多搜狗拼音输入法的错误。

4月8日,Google 拼音输入法更新到1.0.17.0版本,将所有涉嫌盗用搜狗拼音输入法的词汇进行了处理,全面更新词库。当天搜狐发出对Google 拼音输入法的指责,要求Google 中国对盗用搜狗拼音输入法的行为公开赔礼道歉,立即停止盗用了搜狗拼音输入法词库的Google输入法的下载和运营,停止相关产品的宣传,搜狐公司将保留采取进一步行动的权利。当天Google 中国对搜狐的指责进行了回应,表示在Google 拼音输入法词库的试验阶段确实包含了一些非Google(谷歌)的数据源,不过,“现在已经全面更新,欢迎业界监督”。

4月9日,Google 中国的官方Blog--Google 黑板报正式向用户及搜狐等各方致歉,明确向搜狐道歉。

4月10日,搜狗拼音输入法发表了再次声明,表示欢迎Google 中国的道歉态度,但对Google 中国的严重侵犯知识产权的行为表示不能接受,并要求Google 中国立即停止输入法的下载和运营。当日Google 中国进行回应,表示Google 拼音输入法没有侵犯搜狗拼音输入法的专利,并表示Google(谷歌)在中文输入法方面有长期技术积累和多项独创技术,其中包括早在2004年Google(谷歌)的三位中国工程师就申请的一项专利,该专利首创性地利用搜索行为分析和语言模型等一系列相关互联网技术,改进了中文拼音输入法。

以上是对这次Google 拼音输入法的盗用事件的一个回顾,可以说是Google 拼音输入法的这次抄袭事件导致了我对Google 中国彻底失望,失望的原因主要有两点,第一是因为Google 中国辜负了我对其的信任,我之前一直坚信Google 中国不会抄袭,并试图就Google 拼音输入法的这些抄袭证据为Google 中国辩护;第二是因为Google 中国那暧昧的道歉态度,第一次道歉时只表示在Google 拼音输入法词库的试验阶段确实包含了一些非Google(谷歌)的数据源而不明确指出盗用的对象以及在当天还发表了多篇文章意图敷衍蒙混过这一抄袭行为,直到舆论的压力过大才于第二天在Google 黑板报上正式向搜狐道歉。但这整个过程就如挤牙膏一样,Google 中国被一点一点逼着道歉的,每次不到最后关头Google 中国就是死不道歉。而且Google 中国道歉的内容也让我很不爽,“用户及搜狐等各方”中的各方还包括了谁?Google 中国你一次性说出来不要像挤牙膏一样被逼着说出来行不?别到时被别人再揭露一次可就颜面尽失了(虽然现在也好不了多少)。

不过当我开始对搜狗拼音输入法有了一点同情时搜狐自己把这点同情给抹去了,同时还让我对搜狗拼音输入法的厌恶达到了一个前所未有的级别。搜狗表示Google 拼音输入法严重侵犯了其知识产权,要求Google 拼音输入法停止下载和运营。这就是搜狗拼音输入法得寸进尺了,本来Google 中国在为Google 拼音输入法盗用词库道歉后如果搜狐表示接受那搜狗拼音输入法一直不那么好的名声就将有很大改善。但搜狗却得寸进尺地想不让Google 中国做输入法和它竞争,这就导致舆论从支持搜狐重新回到中立甚至是偏向Google 中国了。

PS:提供一份搜狗拼音输入法的专利列表(via Ken

序号 申请号 专利名称
1 200610103593.X 一种提取新词的方法和系统
2 200610127154.2 一种向应用程序输入艺术字/图形的方法及系统
3 200610111562.9 获取新编码字符串的方法及输入法系统、词库生成装置
4 200610109732.X 一种获取新词的方法、装置以及一种输入法系统
5 200610139787.5 一种互联网音频文件的聚类方法、搜索方法及系统
6 200610086577.4 基于互联网信息的输入法词频库的生成方法和系统

首先我不认为搜狐有办法可以证明Google 拼音输入法侵犯了其专利,即便搜狐能证明Google 拼音输入法中的某些功能的效果和其专利描述的效果类似也不能成为Google 拼音输入法侵犯知识产权的证据。正如Google的PageRank专利,基本上被现在所有的搜索引擎的使用了,但也没见到Google去起诉谁啊。这就是表示专利保护的只是特定的算法,只要没有直接盗用算法,即使效果与专利描述相同也不构成侵犯知识产权。要不是搜狗搜索引擎的Sogou Rank早就要被Google起诉侵犯Google的PageRank专利了,我相信如果有可能胜诉Google是会去起诉的,基本上现在搜索引擎比起以前的质量大幅提高很大的一个原因就是Google的PageRank专利提供的这种思路,要是其它搜索引擎都不能使用类似PageRank专利的技术那所Google相对于其它搜索引擎就具有绝对的技术上的优势了,那Google就可以垄断搜索引擎行业了。但从Google没有这么做以及无数的其它事例(如:Vista的图形界面使用了大量Mac OSX的图形界面的技术,但没见Apple起诉过Microsoft)都证明即使在知识产权受到保护程度很高的美国这么做都是没有任何意义的,那又何况在中国这一向来不重视知识产权的国家呢?

其实上文所述不是我对搜狐感到厌恶的主要原因。如果搜狐不大肆炒作而是直接起诉Google 拼音输入法侵犯其知识产权我不会对其感到厌恶,起诉的权利每个人都有。但搜狐很明显是在利用这次事件进行炒作,如果真的如搜狐所说Google 拼音输入法严重侵犯其知识产权,为何在第一次的声明中没有提及,只是提及了盗用词库,难道侵犯知识产权的重要性还比不上盗用词库吗?而且搜狐要是如此有信心应该直接诉讼法律,而不是浪费时间在这里和Google 中国打嘴仗,公道自在人心,如果搜狐赢了官司自然能说明一切了。

而且说实话,搜狐虽然恶意炒作,但实际上也因为中国的特殊舆论而为Google进行了宣传,要是搜狗拼音输入法的用户试用Google 拼音输入法后觉得Google 拼音输入法更加好用而成为Google 拼音输入法的使用者搜狐就真是得不偿失了,用户才不会在乎Google 拼音输入法是否盗用了搜狗拼音输入法的词库以及是否侵犯了搜狗拼音输入法的知识产权呢,只要好用就行。而且如果真的出现这种情况那搜狐就更加尴尬了,“抄袭者”比“原创者”做得更好,那“原创者”指责“抄袭者”很可能就会被理解为一种妒忌了。

这次应该算是Google 中国进入中国以来遭遇的最大的公关危机了,相比前几次,这次Google 中国总算作出了有效的回应,也算是这次事件中Google 中国的进步吧。但不知这是否能让Google 中国真正把公关重视起来呢,要知道现在BlogSpot还是处于被封状态呢,一个进入当地一年都无法保证能让自己的服务正常使用的公司有什么资格谈本地化?

版权声明:本作品作者为IwfWcf,首发于IwfWcf's Blog,转载请遵循知识共享署名-非商业性使用-相同方式共享 3.0 许可协议并注明出处。

2 条评论:

GG 说...

总结的不错~~

虚飞 说...

还是期待google能够在中国有所作为。