那些拔尖的程序员都到哪里去了?这个问题,恐怕只有在需要招聘相关人员或者是对于自己的网站建设感到不满意的企业才会问,毕竟,程序员不是一个热门的职业,而程序员到底是如何分布的,也没有人会去关注。但我可以告诉你的是:绝大部分的拔尖的程序员都不会在看起来为数众多的网站建设公司中。
那么他们在哪里?莫非都与世外高人一样,属于神龙见首不见尾的人物?如果你有看过知乎上那个关于“为什么很多看起来不是很复杂的网站,比如 Facebook、淘宝,都需要大量顶尖高手来开发?”的讨论话题,你大概就能从中找到答案。是的,那些顶尖的程序员都在一些看似普通看似平淡无奇的大公司中,在为*新科技的发展做*早的探路者。
这样笼统的回答你或者无法理解,我们还是来具体的说明一下好了。借用子柳对这样话题的一些回答,你大概能够理解为什么程序员会是这样一个的存在,以淘宝为例:
【搜索商品】――这个功能,如果你有几千条商品,完全可以用select 这样的操作来搞定。但是――当你有10000000000(一百亿)条商品的时候,任何一个数据库都无法存放了,请问你怎么搜索?这里需要用到分布式的数据存储方案,另外这个搜索也不可能直接从数据库里来取数据,必然要用到搜索引擎(简单来说搜索引擎更快)。好,能搜出商品了,是否大功告成可以啵一个了呢?早着呢,谁家的商品出现在第一页?这里需要用到巨复杂的排序算法。要是再根据你的购买行为做一些个性化的推荐――这够一帮牛叉的算法工程师奋斗终生了。
【商品详情】――就是搜索完毕,看到你感兴趣的,点击查看商品的页面,这个页面有商品的属性、详细描述、评价、卖家信息等等,这个页面的每天展示次数在30亿以上,同样的道理,如果你做一个网站每天有10个人访问,你丝毫感觉不到服务器的压力,但是30亿,要解决的问题就多了去了。首先,这些请求不能直接压到数据库上,任何单机或分布式的数据库,承受30亿每天的压力,都将崩溃到完全没有幸福感,这种情况下要用到的技术就是大规模的分布式缓存,所有的卖家信息、评价信息、商品描述都是从缓存里面来取到的,甚至更加极致的一点“商品的浏览量”这个信息,每打开页面一次都要刷新,你猜能够从缓存里面来取吗?淘宝做到了,整个商品的详情都在缓存里面。
【商品图片】――一个商品有5个图片,商品描述里面有更多图片,你猜淘宝有多少张图片要存储?100亿以上。这么多图片要是在你的硬盘里面,你怎么去查找其中的一张?要是你的同学想拷贝你的图片,你需要他准备多少块硬盘?你需要配置多少大的带宽?你们的网卡是否能够承受?你需要多长时间拷贝给他?这样的规模,很不幸市面上已经没有任何商业的解决方案,*终我们必须自己来开发一套存储系统,如果你听说过google的GFS,我们跟他类似,叫TFS。顺便说一下,腾讯也有这样的一套,也叫TFS。
【广告系统】――淘宝上有很多广告,什么,你不知道?那说明我们的广告做的还不错,居然很多人不认为它是广告,卖家怎么出价去买淘宝的广告位?广告怎么展示?怎么查看广告效果?这又是一套算法精奇的系统。
【BOSS系统】――淘宝的工作人员怎么去管理这么庞大的一个系统,例如某时刻突然宣布某位作家的作品全部从淘宝消失,从数据库到搜索引擎到广告系统,里面的相关数据在几分钟内全部消失,这又需要一个牛叉的后台支撑系统。
【运维体系】――支持这么庞大的一个网站,你猜需要多少台服务器?几千台?那是零头。这么多服务器,上面部署什么操作系统,操作系统的内核能否优化?Java虚拟机能否优化?通信模块有没有榨取性能的空间?软件怎么部署上去?出了问题怎么回滚?你装过操作系统吧,优化过吧,被360坑过没,崩溃过没?这里面又有很多门道。
你大概能够了解为什么了吗?是的,*顶尖的程序员都在那些我们认为平淡无奇的网站背后默默耕耘着。谷歌与百度只是一个简单的搜索引擎,但是其中单单是网站排名的算法就涉及上千种,更不用谈他们的其他产品如邮箱、杀毒软件之类的,还有Facebook、Twitter、亚马逊之类的。做一个普通的新村镇商城网站对于普通的程序员来说完全不是一个问题,但问题是,当网站的访问数量从1000人上升到1000000000人甚至更多的时候,任何一个细小的问题都会变成一个巨大的问题了。
拔尖的程序员在为我们所认为的理所当然的流畅的方便的生活与工作服务而努力着。
请立即点击咨询我们或拨打咨询热线: 1823-7777-110,我们会详细为你一一解答你心中的疑难。项目经理在线