百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术

我们今天使用的搜索其实已经是非常智能了,搜索结果按相关性排列有序,甚至可以根据用户搜索的历史记录进行个性化定制。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图1

而这一切都源于与李彦宏的一项专利《超链分析技术》,它为搜索引擎的大规模应用提供了理论基础。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图2

早期的搜索引擎是把互联网中的网站(资源)服务器的地址搜集起来,根据资源类型的不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按分类一层层进入(不是根据关键词进行查询),就能最后达到目的地,找到自己想要的信息。目录式搜索引擎只适用于互联网信息并不多的时候。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图3

李彦宏如何拥有搜索引擎核心技术

彼时,28岁的李彦宏在道-琼斯公司(任职高级技术顾问)牵头开发了《华尔街日报》网络版实时金融信息系统(全球第一个网络实时金融信息系统)。当时每天有15万条资讯,用户每天从15万条资讯中快速找到自己想要的信息。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图4

李彦宏为解决这一难题,突然想到在北大所学的科技论文索引方法:科学论文通过索引被引用次数的多寡来确定一篇论文的好坏,超链就是对页面的引用。超链上的文字就是对所链接网页的描述,通过这个描述可以计算出超链和页面之间的相关度。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图5

李彦宏通过反复论证这一理论,在1996年正式提出“超链分析”概念并发表了相关文章,1997年2月申请了专利《超链分析技术》。超链分析技术的发明,一改互联网搜索杂乱无章、信息冗余的局面,使搜索效果大幅提升。

李彦宏超链分析的论文也被各种研究大篇幅引用,并被世界各大搜索引擎普遍采纳。在1997至2000年间,李彦宏对自己的超链理论也通过论文著作逐步解析和完善,先后在IEEE(美国电气与电子工程师协会)刊物上发表,并不断在互联网搜索领域研究新的解决方案,随后李彦宏的新技术发明又申请了数项专利。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图6

1999年底,李彦宏回到祖国,创建中国人自己的搜索引擎公司百度。如今,百度成长为全球最大的中文搜索引擎及最大的中文网站,超链分析功不可没。目前中文、英文、俄文、韩文等区别较大的语系已经有各自不同的搜索引擎,虽然技术体系各有千秋,但其本质与超链分析却都有千丝万缕的联系,例如Google。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图7

搜索引擎的门槛并不高,尤其是现在

早就有诸如Elasticsearch、Lucene、Whoosh等许多开源的全文搜索引擎,通过“Python写爬虫”爬数据,丢给全文搜索引擎。在家用电脑搞一套简单的搜索引擎。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图8

如果要求再高一点,PageRank、BigTable、MapReduce等论文也是公开的,也有开源实现的gluster、hadoop等架构。照着论文把PageRank在Hadoop上做个搜索引擎,再加上现在比十几年前优秀太多的硬件,也能得到2000年左右水平的google。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图9

但为什么世界上只有美国、中国、韩国、俄罗斯、法国五个国家拥有搜索引擎核心技术呢?

01 引擎的发展速度太快了,没人能跟上它的步伐。

举个例子:

Google公布了GFS、BigTable、MapReduce,但目前最成功的知名复制品Hadoop的执行效率比Google差太远。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图10

何况,Google早就不仅仅靠个PageRank算法了。他们的TPU,可不仅仅是为了搞围棋AI而设计的。它是谷歌推出的计算神经网络专用芯片,为优化自身的TensorFlow机器学习框架而打造,主要用于AlphaGo系统,以及谷歌地图、谷歌相册和谷歌翻译等应用中,进行搜索、图像、语音等模型和技术的处理。

02 搜索引擎具有先发优势和成本门槛

举个例子:

假设你做了一个可以媲美Google的搜索引擎。

但现在的互联网太大是海量的,想达到Google的索引完善度和服务能力,需要的服务器数目、存储空间都是非常恐怖的;就算有这么大的投资,也不可能马上抢到Google的市场,这种投资和打水漂是没有区别的。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图11

随着互联网信息量按几何级数增长,不要妄想一个人找到一个支点就可以撬动整个搜索引擎市场。

商业网络搜索引擎到了今天已经早已不是一个人,几个人,或者几十人的事情了,而是一个大型的软件开发和集体算法研究问题。

百度创始人李彦宏如何拥有搜索引擎核心技术的为何世界上只有四个国家拥有搜索引擎核心技术图12

百度是属于中国的科技企业,截止2020年1月占全世界搜索引擎市场份额12.3%(仅次于Google)。我们不能因为某件事就完全否定一个人,作为一个商业型的企业发展过程中也必然会出现很多的问题,但不可否认的是我们几乎每天通过百度搜索获益,也不可否认百度所做的贡献。

希望百度能够砥砺前行做出表率,也希望更多的中国科技企业披荊斩棘、勇占鳌头。


以上个人浅见,欢迎批评指正。

认同我的看法,请点个赞再走,感谢!

喜欢我的,请关注我,再次感谢!

谢请,我在百度深分呆了三年,我刚好对这块有所了解,我来回答下吧。

我来说个百度大佬李彦宏的故事吧,大家都知道,李彦宏是2000年回国创立的百度。但对于奠定百度搜索引擎根基的“超链分析”专利技术却所知甚少,尤其对于他回国前的一个小故事知道得就更少了。在1998年4月,李彦宏曾前往澳大利亚分享搜索前瞻技术,其中谷歌创始人佩奇和布林也在场。后同年10月Google上线,这一年,谷歌还申请了PageRank的专利,但由于Pagerank与李彦宏申请的超链分析专利具有相似性,美国专利商标局3年后才获准谷歌的专利申请。或许可能大概好像,谷歌搜索引擎也曾受过超链分析技术的启发。

再弱弱地说个事,有或多或少地看到现在还有人抨击百度,而且还是拿那个“ 魏则西事件”来说事。说是百度全责,我觉得,此时要换位思考下,作为一个推广平台,最多只能监控到广告主提供的资质信息,他(她)的一些具体行为除了他(她)自己外,还有谁能第一时间制止到呢?另外对于平台的广告,做为当事人肯定要有一定的辨识能力,有一个词说得好,尽信书不如无书。而且百度给我们生活的方方面面带来的便利还少吗?希望我们不要去做一个,喝了奶还骂娘的人!

最后还有不少声音说百度不行了,如果有谷歌早就不用百度了。我只能说这些人对中国的互联网了解的太少,就算当年谷歌在中国市场上都被百度正面打败(具体可以自行查看当年市场份额,就不另外展开说了),更何况是其它ABCD呢?连当年谷歌的创始人都还有听过“李厂长”的课,可见百度实力一斑。百度近些年战略有所收缩,但在AI和人工智能这块下了不少心力,而且在无人驾驶和小度智能音箱这些方面的进展有目可睹,祝愿百度越来越好,也希望中国科技能一日千里,早日登上全球科技强国首座,加油!

版权声明:本文来自用户投稿,不代表【闪电鸟】立场,本平台所发表的文章、图片属于原权利人所有,因客观原因,或会存在不当使用的情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系(邮箱:dandanxi6@qq.com)我们将及时处理,共同维护良好的网络创作环境。

(0)
上一篇 2022年10月28日 11:14
下一篇 2022年10月28日 11:25

相关推荐