推荐序
数据智能作为新基建中的核心领域,具备前所未有的变革能力,它正在对现有的生产生活方式、商业模式甚至经济结构产生着巨大的推动作用。算法技术与数据技术的深度结合是实现数据智能的基础。以机器学习为代表的人工智能,逐渐发展成为当今最为主流和最具影响力的算法技术。它不仅在推荐、搜索和广告等经典的互联网业务中完美地证明了自己的价值,而且在解决现实生产和生活中的实际问题上,也逐渐彰显出了不可替代的巨大能力。在机器学习被不断地实践和应用的过程中,数据技术特别是大数据领域的相关技术,也取得了长足进步,并成为机器学习算法赖以生存的土壤。数据智能领域的技术进步,和互联网本身的蓬勃发展是密不可分的,两者相互促进,相辅相成。技术的进步不仅可以为已有互联网产品的智能化升级和改造进行赋能,它也是许多新兴互联网业务得以开展的基石,而互联网的发展则为算法技术与数据技术的实践和进化提供了广阔的舞台。
新浪微博作为全球最大的中文社交媒体平台,不仅具有海量的用户规模和平台内容,而且具有社交性和媒体性这两大突出特点。面对不断增长的博文信息及愈加丰富的用户行为,新浪微博一直以来都致力于利用数据技术和算法技术来驱动业务发展和产品迭代。在多年的中台建设过程中,微博平台已经基本实现了数据的共享及通用能力的复用。当下,无论是微博推荐流、视频推荐和微博热搜等用户产品,还是超级粉丝通和粉丝头条等广告产品,都离不开技术中台的强有力支持。特别地,在中台建设过程中沉淀下来的数据技术和算法技术,已经成为各个产品和业务进行智能化升级和个性化改造的核心推动力。
本书作者充分结合了中外知名互联网企业的实践经验,对较为通用的算法技术、数据技术,以及背后的中台建设历程进行了较为详尽的介绍和总结。在此基础上,本书还对推荐系统、计算广告,以及本地生活服务这三个经典互联网业务中的实际产品进行了案例剖析,这些内容颇具实践价值和指导意义。本书文笔流畅,具有广阔的技术视野,内容颇具深度,是一本优秀的参考读物,特此推荐给互联网以及信息产业的相关从业人员。
——新浪微博CTO 刘子正
前言
成书背景
在中美各大互联网企业的中台战略实施过程中,人们对中台建设的目标逐步形成了原则性共识。大家普遍希望通过中台战略来实现数据整合、技术沉淀、能力共享和功能复用,并期望以此为切入点来引领组织架构的升级和重塑,从而大幅度提高研发效率、执行效率、组织效率和决策效率。毫无疑问,一个可靠且强大的中台可以为各种前台业务进行赋能,以便支撑它们进行快速试错、快速决策和能力提升。
在纷繁复杂的技术中台体系里,算法中台和数据中台是紧密联系的。算法对于挖掘数据的内在规律并充分发挥数据的潜在价值有着决定性意义,而数据又决定了算法的效果上限,并且大部分算法的生产过程离不开数据计算平台的有力支撑。由此可见,将算法中台与数据中台作为一个有机整体来进行技术规划、技术建设和实际应用具有充足的合理性和非凡的现实意义,这既是许多知名互联网公司的实践方式,也是本书创作的初衷和意义。
我们在对 Google、Facebook、新浪微博及滴滴出行等多家世界知名互联网企业的具体实践进行总结的基础上,围绕算法与数据中台的功能价值、构建思路、技术体系、实践案例和应用前景进行了深入讲解与剖析。我们建议并殷切希望读者带着思考来进行阅读,从而形成自己对于中台战略以及算法与数据中台的理解,并将书中符合自身需要的经验复用到日常的工作、学习和研究当中。
本书内容
本书分为 3 大部分,共 9 章,全面介绍了算法与数据中台的产生背景、技术体系和实践案例。
第 1 章对互联网企业的中台战略,特别是与算法技术和数据技术相关联的技术中台进行了背景分析和案例简介,并阐明了算法与数据中台的重要价值以及应用前景。
第 2 ~ 6 章对算法与数据中台的技术体系进行了深入剖析,并围绕基础设施平台、在线算法平台、机器学习平台、分布式数据库平台和大数据平台这几个核心的组成部分进行了详尽的技术探讨。
第 7 ~ 9 章选择推荐系统、计算广告和网约车平台这三个经典的互联网业务场景进行了案例分析,以便通过具体的应用实践来加深读者对于算法与数据中台的理解。
目标读者
? 互联网行业,特别是从事个性化系统、计算广告、大数据平台及技术中台建设的相关从业人员。作者希望本书能够为业界同行带来一定的感悟和启发,并希望书中部分成功的实践经验可以因地制宜地被推广和应用到更多的日常工作与研究当中。
? 对机器学习、深度学习、大数据和分布式计算感兴趣且有一定理论基础的读者。本书可以帮助这类读者对相关的技术要点和实施方案进行系统化的梳理,并引导他们对感兴趣的技术话题进行深入学习。
? 计算机专业的高年级本科生、研究生和博士生。本书具有广阔的技术视野且语言平实,有助于在校学生加深对计算机学科中的相关理论、技术和应用的理解,从而帮助他们构建一套较为完整的知识体系。
交流沟通
算法技术和数据技术的发展可谓日新月异、一日千里,而作者的精力和水平有限,因此本书内容难免有一些纰漏甚至错误。诚恳地邀请所有读者将阅读过程中所遇到的问题和困惑,以及建设性的改进意见反馈给我们,作者定当在力所能及的范围内第一时间回复有价值的邮件信息。
邮箱:algo.data.zy@gmail.com
QQ:2515475864
诚恳致谢
成书过程是艰辛的,十分感谢在本书的创作和出版过程中给予帮助、支持和鼓励的所有领导、同事、业界同行以及出版社的工作人员,祝大家心想事成。特别地,感谢毛镭在审稿和校对过程中给予的帮助与支持。
詹盈
中国北京 / 美国纽约
2020 年 7 月
a***s 2020-09-02 18:53:19
不错,,,,,,,,,,,,,,,