路易斯·冯·安——验证码之父

发布时间：2024-11-06 17:21:53 / 浏览量：

路易斯是一个计算机天才，17岁进入卡内基梅陇大学，在大学时期，他凭借良好的表现获得了导师曼纽尔·布鲁姆(ManuelBlum)的赏识，他的傲人履历也很可能是雅虎向他伸出橄榄枝的原因。
在研究过程序机器人的“工作手法”之后，他给出了一个独特的方案：在用户进行操作之前，就将那些机器人从正常用户里揪出来。大家都知道图灵测试的目的是将机器伪造成人类，而路易斯的方案就是“反”过来：通过简单的方法将试图伪装成人类的程序机器人鉴定出来。
好了，现在大家来想想，有什么是人类能够轻易做到，而机器不可能的呢?
数学题?机器做得比人类出色多了;
写一篇洋洋洒洒保证书保证“我是人类”?机器绝对写得又快又好;
画一幅画?拜托，谁有空每次在论坛发一次贴就画一次画?而且说真的，机器画画也绝对比人类强;
晒出自己和电脑屏幕上的信息合影的照片?哪有那么多工作人员有空一个个审核呢。
路易斯发现，人类可以用肉眼很轻易地识别图片里的文字信息，而机器就不能。当时的计算机辨识技术还很落后，对于那些镶嵌在图片中的、被扭曲过、污染过的文字无法辨识，而人类只需要稍稍皱眉就可以识别出来。路易斯在导师布鲁姆的帮助下很快设计了一个程序，它先是产生一个随机的字符串，比如smwm，然后对这串字符进行随机的扭曲、重叠、污染，再显示给要进行操作的用户。只要能够识别这个变形了的smwm的，就是人类。
21岁的路易斯·冯·安发明了验证码后真是名利双收，但他享受了掌声和鲜花后冷静了下来，为一件“小事”感到耿耿于怀：全世界的网民每天要输入验证码接近2亿次，假设每次花费10秒，那么算下来每天要花费50万小时。这个时间如果能利用起来，那将会有多大的力量啊。
说干就干的路易斯很快开工了：他扫描了一些过期的旧报纸，将扫描得到的图片在计算机的分析下拆开成单词片段，再将这些单词作为验证码发送给用户。有人要问了，先前的那些验证码，系统是知道答案的，但这些书籍拆下来的单词，系统自己也搞不清楚答案，那怎么知道用户的判断结果对不对呢?
用这一个方法，在短短几个月时间内，路易斯让网民们帮忙完成了纽约时代130年来所有旧报纸的存档电子化——这原本可是个让人望而生畏的大工程啊。reCAPTCHA很快被Google收购，现在已经成为了Google旗下的一项免费服务：任何人都可以申请将reCAPTCHA用在自己的网站上，你不仅可以为你的网站建立一个防止垃圾信息的堡垒，还让你的用户们得以参与到完善人类电子图书馆的丰功伟业中来。

上一篇：阿塔纳索夫和他的靠前台“ABC”计算机

下一篇：吴建平——互联网工程科技领域开拓者和学术带头人