第一百二十三章 系统改造与技术升级(4/5)
这首先涉及到负载均衡的第一步,通过dns解析域名,把你的访问分配的不同的入口,尽可能保证是所有访问入口中,最快的一个。”
隋波点点头,这样说的确很清晰。
庞勇继续道:“当你通过入口成功访问我们电商网站时,就产生了一个pv(pageview,页面访问量),同时你作为一个独立用户,这次访问网站的所有页面均算成一个uv(uniquevistor,用户访问)。”
隋波继续点点头,pv和uv是网站规模的重要指标。
“因为同一时刻访问网站的人数太多,所以,生成网站首页页面的服务器不能是仅仅一台,目前我们用户生成易趣和淘宝两个电商网站首页的服务器就接近100台,通过负载均衡系统,后台系统会分配给其中一台服务器完成。”
隋波明白了,负载均衡系统是第一步。
“通过一系列复杂的逻辑运算和数据处理,给你看的网站首页的html内容就生成了,浏览器下一步会加载页面中用到的css、js(javascript)、图片等样式、脚本和资源文件。
因为同一个域名下并发加载的资源数量有限,为了保证用户访问网站的速度,就需要采用cdn来保证流量的分散和就近的cdn节点。”
隋波默默点头,对cdn他还是有一定了解的,前世时,bat三大巨头都在全国大规模的布置cdn,就是出于数据和网站的效率。
庞勇继续介绍:“当用户开始浏览首页,你可能只是没有明确的购物意图和目标,只是随意看看,也可能是有一定的购物意图,主要是属性上的需求,又或者已经有了明确的目标,只是进行表和挑选。
这就需要通过网站内的分类目录和搜索来完成。
其中分类目录背后,就是刚才我提到的forest系统。而搜索,目前我们暂时采用了站内搜索的方式,后续会和百度搜索团队沟通,借鉴更精确的搜索技术,做到站外搜索能够直接链接到商品页面。”
隋波点头表示知道了。
“你找到心仪的商品后,可能会有打开图片,或者浏览商品详情,加入购物车等等行为。
不论你是否进行了交易,你的访问行为都会被系统如实记录下来,用于后续的业务逻辑和数据分析。
这就涉及到了分布式数据存储和用户信息中心系统。
就这样,用户的浏览数据、交易数据和其他数据记录不断保存和积累在我们的数据库中。
并通过我们基于数据计算平台的,由数百台服务器组成的数据系统,进行不断的分析和挖掘。”
隋波听到这里,这才笑道:“你早这么给我介绍,就很清楚明白了!”
我听了一下,现在你们“大中台”事业群的问题是两个方面。
一个是硬件上的升级,一个是软件上的升级,对吧?”
庞勇噎了一下,无奈点头:“这么说……,也没错。”
本章未完,点击下一页继续阅读。