找回密码
 新注册用户
搜索
查看: 3833|回复: 2

Google将可直接识别图片及视频里的文字

[复制链接]
发表于 2008-1-7 17:41:20 | 显示全部楼层 |阅读模式
http://www.gseeker.com/50226711/googlececeeec_134111.php



  Google搜索引擎之所以会成功,除了PageRank算法能更好地对网页进行排名外,还得益于Google强大的基层结构,能有效地分析及收录互联网上的内容。我们都知道Google派出的爬虫Googlebot会不断地访问互联网上的网页,然后将其中的内容进行分析及收录。但一直以来这种机械式的爬虫最大的缺点便是它们对文本以外的内容比如图片及视频等基本无能为力,只能通过分析图片或视频附近的文字来猜测其内容。但互联网的发展趋势已是多媒体内容的比重日益增大,因此如果无法很好地解决图片、视频等内容的分析及收录,搜索引擎本质上还只是文字搜索工具而已。但现在看起来情况或许有改变。

  根据TechCrunch引述信息周刊的报道,Google在去年7月获得了一项专利,而专利的主要内容正是一种使爬虫能读懂图片及视频里的文本内容的方法。这即意味着Googlebot在将来可以像人类一样看得懂图片及视频的文字内容。这将会是搜索引擎史上的一大突破,因为文本、图片及视频是互联网内容里的主要元素,而Google有能力将它们更好地收录,这或将会改变互联网的面貌。

  这种技术几乎可用于改进Google所有的搜索产品,特别是图片搜索、YouTube、图书搜索等等。试想一下输入"很黄很暴力"后,马上可找到所有包含该短语的YouTube视频及图片,那将会是怎样一种强大的搜索功能(嗯,我们不期望会在中国能用这种强大到令某些人害怕的搜索技术)。当然,它也并非万能的,因为并不是所有图片及视频里都包含有文字,但这至少会是搜索引擎进化过程中极其重要的一步。并且别忘了这种技术不仅可使用户获得更优秀的搜索体验,Google的广告也将会有更广阔的发展空间。因为光是一个YouTube,如果爬虫能读懂视频内容,Google就已经可大赚特赚了。

  诚然在当前阶段,谈论这种技术的具体发布日期还太早了,但我们至少可以对互联网抱有一些期望和憧憬。
回复

使用道具 举报

发表于 2008-1-7 18:00:03 | 显示全部楼层
非专业 看看~~~~
回复

使用道具 举报

发表于 2008-1-7 21:26:16 | 显示全部楼层
那"验证码"还有用么?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-4-22 05:59

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表