从身高遗传问题谈起
父母的身高与孩子的身高有什么样的关系?
这是一个有趣的问题。按照我们的常识,父母的个子越高,子女的个子大多越高,甚至可能高过父母。但如果子女的个子总是高过父母,那么经过多年繁衍,人类的身高岂不是要突破天际?
19世纪,英国著名遗传学家、统计学家弗朗西斯·高尔顿(Francis Galton)收集了1078对父母与子女的身高样本数据,发现子女与父母的身高呈线性关系,即如果把父母的平均身高设为x,子女的平均身高设为y,那么可以用一个线性函数来表达它们之间的关系:
y=f(x)=wx+b
其中,参数w和b均为实数,因此这样的线性函数理论上来说有无限多可能。如果用二维坐标来表达,将参数w映射到横轴、参数b映射到纵轴,我们会发现这样的线性函数和二维平面上的点一样多。那么,在这众多的线性函数中,哪一个函数最能真实地描述样本数据中呈现的线性关系?为此我们可以从样本数据出发,用预估结果与实际结果的平均误差来定义一个选择函数的评估标准——样本数据的均方误差δ:
δ=1N∑Ni=1(wxi+b-yi)2
均方误差越小,意味着这一组参数(w,b)越接近世界的真相。仔细观察我们会发现,均方误差δ实际上是一个关于w和b的二次函数δ(w,b),因此,可以在三维空间用一个开口向上的抛物面来描绘这一函数,抛物面上的每一个点(w,b)都代表了一组参数,即唯一确定了一个线性函数。
如下图所示,这个抛物面的最低点(w*,b*)即我们希望得到的使均方误差δ最小的一组线性函数参数。由此,高尔顿从样本数据中最终得到子女与父母身高的关系y=0.516x+0.8567(单位为米)。系数w小于1意味着人类的高个子基因不会永远遗传下去,而是最终回归到一个均值,这样的方法也被称为线性回归。
而像上面这样的思考和求解过程可以用一个最优化公式来表达:
w*,b*=arg minw,b δ(w,b)
即最低点(w*,b*)是使得评估标准函数δ(w,b)最小的一组参数,这组参数也唯一地确定了一个线性函数y=f(x)=wx+b。
以小见大,我们对世界的解读便从这里开始。
产品经理需要懂算法吗
过去,产品经理总是因为“产品经理需要懂技术吗”这个问题而焦虑。新时代的来临让这个问题发生变化,也让许多产品经理开始试图在众多算法资料中寻找答案,并陷入各种算法细节中不能自拔。
从字面意义上理解,“算法”一词指计算方法,既包括技术类文章中常见的排序算法、贪心算法等,又包括机器学习中的一些求解算法,如梯度下降法、牛顿迭代法等。而另一个概念——“模型”则是对问题的形式化定义,即用形式化语言表达要解决的问题,这是对这个世界认知的第一步。因此,在上面身高遗传(线性回归)的问题中,模型指的是利用线性函数与最优化公式对问题进行表达,而算法则是在模型确定之后具体求解参数(w*,b*)的过程(如对参数求导并令导数为零,即最小二乘法)。
然而,市面上许多资料并不会严格区分这两个概念,例如当人们提到推荐算法时,实际上既讨论了推荐模型,也讨论了推荐模型的算法。过去我也是这样混用的,在本书写作过程中才意识到,概念的厘清有助于读者尤其是初学者把精力放在真正应该了解的内容上面。
同时我还意识到,并不是所有公司都能像BAT这类大公司一样拥有成熟的业务、完整的团队建制和稳定的系统架构,并且即使是大公司,也在不断催生新业务、面临新问题、产生新模块。因此,对于大部分人尤其是广大中小公司的产品经理而言,了解一个问题解决方案的演进路径比了解成熟方案更为重要。
那么回到最初的问题,我对这个问题的回答是:“作为用产品表达这个世界的角色,新时代下的产品经理可以不懂算法,但一定要懂模型及其演进路径。”
读者对象
本书面向策略产品经理,适合所有策略产品经理或希望成为策略产品经理的读者,包括但不限于以下人群。
在搜索、推荐、广告、定价、匹配调度等业务场景中工作的产品经理;
以增长、商业或风控为目标的产品经理;
工作中频繁接触数据、算法、AI等技术的产品经理。
正如书中介绍的那样,策略产品经理集合了上述这些产品经理的某些共同点,相信本书在深入解读这些共同点的同时,能够给你的工作带来一些帮助。
同时,本书也适合以下读者。
有理工科、商科背景或有相关学科扎实基础的在校生,希望毕业后从事策略产品经理方面的工作;
工作一段时间后处于迷茫期的数据分析师,希望了解如何从数据中挖掘更多价值,并在职业规划路径上向拥有决策权的下游发展;
与策略产品经理搭档最多的数据、算法工程师,希望更多地从业务出发,了解数据与模型算法如何在整个产品链路中产生价值。
最后,所有对人工智能感兴趣、希望入门机器学习的读者,在学习聚类、分类等模型算法细节以及Python、TensorFlow等工具之前,也不妨先读一读本书。相信你能在本书中了解机器学习的本质,以及在各场景中如何将一个实际问题用统一的模型语言表达出来,这对未来学习具体的机器学习模型与算法有很大帮助。
本书特色
在学生时代,我们学过各种各样的学科模型,例如数学模型、物理模型、经济学模型等。参加工作后,在不同的岗位也会接触不同的业务模型,例如财务人员会使用财务模型、产品经理会使用用户模型、运营经理会使用运营模型等。
“模型”这个词听上去就像“方法论”一样,有时让人讨厌,有时令人生畏。上面提到的这些模型可能差异很大,但所谓的“模型”本质上都是力图用最简洁的语言描述某个事物的运行规律,并提升运行效率以及预测未来发展。
所以,策略产品经理经常会接触的搜索、推荐、广告、定价或者匹配调度这些看上去关系不大的应用场景,背后隐藏的规律都可以用具有一定共性的模型来解读,这样的解读能够让本书用最少的篇幅解释明白问题的本质,也能够让读者在一定程度上对类似的问题举一反三、融会贯通。这可能也是本书与同类书籍不太一样的地方。
同时,每一本书都有它的局限性,或局限于时代背景,或局限于作者阅历,或局限于作者能力,本书也不例外。与我处于同一时代的读者,或许更多时候感受到的是后两者。
(1)我毕业于计算机与智能科学专业,是工程师出身,因此本书在知识结构、行文风格方面难免会偏理工化,所以大家可以站在更加辩证的视角阅读本书。
(2)书中来自我工作的一手案例有限,这与我的工作经验、阅历有关,也与我参与的部分项目有保密需要有关,因此我会用调研的一些学术界和工业界的资料对相关内容进行解读,或将一些案例抽象成知识点并穿插在书中。
(3)一本书的篇幅总是有限的,正如前面我们谈到的那样,毕竟本书目的不是让大家成为算法工程师,因此书中对一些偏实操的内容进行了删减,把更多的篇幅留给了模型原理介绍。这些刻意隐去的内容包括但不限于以下内容。
特性工程与数据预处理技术;
过拟合与应对方案(L1与L2正则、Dropout等);
模型求解算法(求解析解法、梯度下降法、牛顿和拟牛顿法、EM算法等)。
有需要深入了解的读者可以参考其他技术类书籍。
如何阅读本书
本书逻辑上分为三部分。
第一部分为概览篇(第1~2章):这部分从当下技术与市场环境变化的角度出发,介绍一个正在逐渐火热的职位——策略产品经理,并简单讨论这一职位的本质,以及其与常规产品经理在工作内容、职责和能力等方面的差异。
第二部分为方法篇(第3~8章):其中,第3~6章介绍了策略产品经理两个最常用的方法论——函数方法论与经济学方法论,并配有一些案例的简单分析与解决方案的演进;第7~8章沿着函数方法论的脉络,介绍一些常见的机器学习模型,以及一些前沿技术对策略产品经理工作的影响。
第三部分为能力篇(第9~12章):第9~11章对第2章提到的一些能力项做进一步的讲解与阐述,包括数据分析能力、沟通能力、项目管理能力及判断能力;第12章介绍拥有不同工作背景的人转型策略产品经理的优劣势,这一章还针对组建策略团队给出了一些建议。对于这部分内容,大家可以根据自己的情况选择阅读。
2020年,针对产品经理的常识性教育已普及,用户体验、需求等概念早已深入人心;另外,新时代的来临让产品经理需要涉猎的内容更加广泛和深入,无论是业务(如搜索、推荐、广告等)还是能力(如数据分析等),每一块内容都很多,都足以单独成书。因此,本书选择迭代式地从一些行业与场景的新变化角度切入,通过模型将这些内容串联起来,以此讲述产品经理的未来。
勘误与支持
由于作者的水平有限,编写时间仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。如果读者发现书中的错误,或有更多的宝贵意见,也欢迎发送邮件至214399230@qq.com,期待能够得到你们的真挚反馈。
同时,你也可以关注我的微信公众号“青十五”(ID:qingshiwu365),书中提到的参考资料,包括脚注中的网页链接,都会打包后在个人公众号中提供给大家。
青十五
Nicholas啥都行 2020-09-23 09:12:50
实话说真的是非常喜欢的一本书,因为这本书对于我的工作帮助很大,我最近一直在做课程,很需要这方面的书,然后这个恰好就弥补了我在数据分析和对于具体业务也就是他们眼里这一块儿的一些缺陷,所以他对我的帮助很大。我看了一下整个目录和大纲,里面的内容非常的详细,整个作者在这块儿也是非常专业的,会继续支持。