第489部分
3个月前 作者: 浙东匹夫
“比如,当我们的算法和大数据再积累一年半载,略有小成。我们可以在过渡阶段弄一个未读池的概念。比如一个用户在初见上订阅了好多公众号、关注了很多明星,然后每天刷出来的动态有几百条,他们根本看不完。这时候,咱从目前的‘猜用户喜好’推送排列,改为设置一个‘未读池’,用户觉得闲着无聊,主动点击一下‘刷新’,就给他刷出几十条实际上我们用推送人工智能筛选过权重、揣摩过他喜好的内容来。因为用户主动点击了这一下‘刷新’,所以他们不会有被人揣摩的恶劣体验,只会觉得这些东西是他主动去拿的——但实际上还是我们揣摩后送的。再往后,等这个能力彻底大成,我们就可以把所有有行迹的推送渠道和推荐位统统干掉——只留下一个‘初秘’人工智能助手。等用户对着自己的手机喊一句‘我想看都市文’、‘现在的电影无聊死了’,就揣摩出对方的心意,然后给他一些算法认为他想要的——这种时候,用户的体验完全是一个主人在使唤一个机器人小秘,怎么还可能存在‘用户体验不爽’的问题呢?”
“这都行?嘶——这么一看,好像还真是什么都解决了诶。”
陆文君略微脑补了一下,一想到初音未来可以做到让一个软糯的语音助手发出女声,在‘狗吸金萨马’发出命令后立刻送上他想要的东西时,谁都扛不住这种服务啊。
“可是……初秘能够做到这个功能么?以前我们训练初秘,和苹果训练SIRI,不都是靠‘统计最高频次的几个回答,选出最有可能优选的标准答案’来训练的么?但是每个人的偏好,是众口难调的啊,靠对大多数人的选择进行统计、给出概率最大的结果,完全做不到你刚才说的目标吧?”
第八十一章
物联网不是你想的那个口号
“你说的那个,只是推送人工智能的上半场。”
顾莫杰又喝了口薄荷茶,对于陆文君没完没了的质疑已经有些疲劳了。
一个女人,在这个瞬息万变的时代,脱离前沿技术将近两年,怎么可能一夜之间,就靠枕边风补回来嘛。
喝完茶,他反问陆文君:“从我们刚提出‘给的再多、不如懂我’或者‘猜你喜欢’这些概念的时候,我们最初是怎么做的。还记得么?”
许是因为精神旺盛,陆文君回答得很快:“当然记得,不就是和我刚才说的那样么:优先训练机器人回答那些有标准答案的客观题,比如百度知道上已经有经过审核的正确答案的题目。然后再轮到那些百度知道上还没有答案、但是有人问、咱用专门雇佣的回答问题团队找资料、回答、审核、上传——我记得你那年两会的时候,为了推动中国铁塔的成立,为了给移动和电信被淘汰下岗的人找工作,不就弄了个人工智能中心,吸纳了十几万人专门答题、训练客服型人工智能么。”
顾莫杰总算有些欣慰,妻子的水平还没因为育儿而彻底还给老师。至少她怀孕之前已经知道的事情,至今都还记得。
“对,就是这样。那种人工智能,只能优先回答客观题,也就是有标准答案的题目。很适合当客服,当热线接线员,因为客服要回答的问题都是逻辑性很强的,很容易排查标准答案——
你不说我还忘了,从移动电信挤出来那十几万人,咱三、国家七,养着他们训练了两年,如今公司的客服型人工智能成长非常快,现在已经可以拿给各地的运营商、银行、机关衙门、法院进行测试了,估计年底就能通过验收。
明年开始,这些机关和事业单位就不用再在公务员招聘考试的时候招客服和接线员了。这两类人的工作,会永远在公职系统内被消灭。目前已经混进公务员和事业编的客服,已经够他们将来作为机器人客服的补充,用到死了。
再过一年,这个进度可以蔓延到相当一部分的企业单位客服人员。”
顾莫杰把这些信息和妻子说了一下,才发现自己扯远了,赶紧回到刚才的话题上。
“前面说了,让机器人‘听得懂’一切用人类语言提的问题、并且准确回答其中那些有标准答案的客观题,这就是深度学习算法对问题回答型人工智能的训练的上半场。然后,从去年下半年,搞定NHN之后,咱的问题回答型人工智能已经发展到下半场了,严磊和他的研究院,如今天天就忙那些。只不过你在休产假,没了解罢了。”
“具体给我说说嘛,人家真不想脱节前沿太久,被人以为没见识。”陆文君的技术宅妹属性,也算是天生的了,并不是为了赚钱才对数理内容好奇的。作为顾莫杰的妻子,她绝不希望自己在生意上辅佐丈夫的价值就此终结。
“这个下半场,就是:当客观题部分,采用公用的大数据池训练完毕后,主观题部分,我们要依靠对每个用户细致入微的行为分析,来做到私人订制的‘初秘’。也就是说,数年之后,每个‘初心’手机上的‘初秘’机器人,在回答各自主人提出的主观题时,答案是不一样的。这里面再也不依靠‘大样本容量的统计’来实现偏好筛选,而是完全按照每个人的喜好量身定做。”
陆文君歪着脑袋想了想:“每个人都根据自己本身的行为数据来揣测,那岂不是一开始很不准?那些不愿意配合、不愿意把行为习惯隐私泄漏给初音的用户,我们岂不是很难有进展?何况单个个体产生的数据频次太低了,很难通过聊聊几条信息分析出一个人的喜好啊。”
顾莫杰摆摆手,示意陆文君不必担心。
“你不懂里面的技术原理,就别瞎担心。这是一个循序渐进的过程。比如,我举个例子,就拿看书而言,曾经我们是把用户分成几个大类,有的用户爱看玄幻,有人爱看都市,有人爱看历史。然后他看哪类比较多,就把这一类最火的书推给他——这是最原始的弱智状态,都称不上人工智能。
第二步,当他有限地看了几本书之后,大致可以摸清这个人的脾胃。然后根据和他行为模式类似的人,按照‘人以群分’的算法,推而广之认为他和哪类人是一样的,把那一类人都比较爱看的东西推送给他。
如果他接受了,那么就留下一个喜好的数据烙印,如果他拒绝了,就进一步细分人群。这样一步步推进,最后用户会从数百万人一群的大群、细化为数万人的小群、最后甚至是数百人的小群。
这些人的经历、喜好、脾性其实是高度吻合的,也就容易捆绑成一个数据圈子,相互引用推送结果,进一步反馈推送效果——这样循序渐进,最终就可以勾勒出一个个独一无二的‘人’的需求。”
中国那么大,十亿网民里面,但凡细分到数百人一群的时候,对娱乐内容的喜好基本上可以做到完全相同了——毕竟,放到人群的总体样本来看,那都已经是百万分之一的小众需求了。
这么大一个国家,哪怕是再孤僻、特立独行的个体,好歹至少也有几百个人和他是兴趣爱好完全相同的,这种小概率事件并不奇怪。
初音系的人工智能要做的,就是在日渐分析中,把人群越分越细,或者兼顾几个判断维度交织一张数据评价之网,最终让“初秘”变得和主人内心的幽灵一样精准。
这样,任何人都离不开“初秘”了。
一旦离开,就会像顾莫杰怀念初音娘一样怀念。
陆文君反复咀嚼顾莫杰的话,最后终于豁然开朗。
“原来是这样……这都可以!”
“没什么不可以的,其实我们初音的这个想法,从理论上来说,曾经有很多空想家考虑过。只不过那时候没有深度学习型人工智能,这些空想家没法实现。而且这种设想实现之后,可以起到的社会效果和经济价值,也远远不是你现在可以想象的。”
顾莫杰顿了顿,开始说那个案例。
“18年前,凯文·阿什顿在给迪奥化妆品公司做市场调研工作的时候,就提出一个概念,叫做物联网——他幻想,有朝一日不仅人类要连接到互联网中,连产品也要链接进去。届时一件产品是否被主人选中、买走;主人喜不喜欢这件产品,都应该有一个数据追踪的反馈,好让商家做出决策。而导致他提出这个概念和诉求的,正是他在迪奥观察唇彩销售数据时,发现的一个现象。”
女人一聊起化妆品,那都是两眼放光的。
陆文君一听卖口红都能卖出那么重大的改变世界的哲理来,顿时耳朵都竖起来了,浑似一只波斯猫:“快往下说!别墨迹。”
顾莫杰智珠在握地笑笑,继续说道:“凯文·阿什顿当年发现:迪奥公司的市场报表上,总是显示,某一种洋红色的口红,销量特别好。公司也经常增产这种颜色的口红,每每供不应求。在市场数据的良好反馈之下,这种颜色就继续增产,其他卖得不好的颜色则减产。
直到有一天,迪奥公司发现这种洋红色的口红终于出现滞销了、产量超过市场需求了。而且他们进一步赫然发现——在他们不断增产这种畅销洋红色口红的市场,他们的总口红销量出现了增长停滞、甚至是下滑。
然后,他们又横向对比了其他代工厂和市场大区的情况——因为每个市场大区搜集的用户偏好是不同的,所以因为洋红色特别畅销而立刻响应、相应最彻底的,只是迪奥公司的英国部分。
最后,他们得到的结论是:英国迪奥在对客户的口红颜色偏好方面,响应最积极,有数据反馈就立刻调整产量。但是他们的口红销售业绩增幅,是其他欧洲国家分区里最差的。”
陆文君听得很仔细,细细咀嚼了顾莫杰举的例子,好半晌都觉得不能理解。
“你是说,对市场销量反馈数据越迟钝的分公司,反而后来市场业绩越好?对市场反馈越积极、越增产畅销款、减少滞销款的分公司,反而努力了没好报?这不可能吧,完全和我们的认知常识相悖啊。”
“你也觉得不可能是吧?对,一开始我也觉得不可能。但是当我看完凯文阿什顿的物联网理论之后,我觉得这很正常。”
“快说快说,别卖关子。”
“因为,口红是一种差别很细腻、很难标准化的产品。众所周知,护肤品、眼霜、面膜、粉底,这些别的化妆品,没多少规格,一个系列,就三五个款式,足够了。口红完全不一样,一个口红系列出来之后,有一排的比色卡,从粉到红到紫,各个色度由浅到深能排列组合出至少三五十个颜色款式。所以生产口红的部门,往往是化妆品公司里最头疼的部门——规格太多,每样都大批量备货,很容易导致客户不太喜欢的颜色滞销,永远卖不出去——”
“诶呀这些我都知道,你直接说重点。”陆文君一阵焦躁。
姐堂堂一个妹子,还用自己老公科普口红产业的特点?这不开玩笑么。
第八十二章
从来就没有什么救世主
“好,那我直接说重点。”顾莫杰没想到随便拖一个妹子都对口红这么了解,竟然不需要他扫盲基础知识,也就直截了当说戏肉了。
“当年物联网之父凯文阿什顿在迪奥口红调查的时候,就发现,迪奥公司在统计数据时漏掉了一个很重要的纬度,那就是时间。
迪奥的市场调研数据,是一月一结的。也就是说月初给每个门店上货,然后统计上一个月各个品类的销量、作出报表。到月底再来上货的时候,再统计一次差额。
按照这种统计方法,迪奥的市场部门得出了某洋红色——我们暂且称为洋红色A——的口红,几乎每个月都能卖完。而诸如鲜红色B或者粉红色C这种颜色,销量相对也不错,几乎总有在某一些店里卖完,但在更多的店里卖不完。
然后迪奥作出了销量调整,把洋红色A增产、鲜红色B和粉红色C减产,试图减少总滞销。最后却不得好死。
凯文阿什顿接手这个疑难杂症之后,选择了紧盯几个门店,每天统计。然后,他发现了一个此前数据不够细致时无法发现的秘密。”
陆文君已然听得进入了“心流”的状态,胸中的八卦求知之火熊熊燃烧:“快说快说,然后呢?”
顾莫杰:“他发现,在他跟踪的那些店里,洋红色A其实都并不是最先卖完的。
有些店里,是鲜红色B先卖完了,然后有些个性很强、不愿妥协的完美主义消费者,发现买不到鲜红色B,逛了一圈,走了;另外一些个性不是很强、很容易随大流的消费者,发现至少还有相对而言颜色比较接近、勉强能接受的洋红色A有货,买了洋红色A。
在另外一些店里,最先卖完的是粉红色C,然后后面的剧情和前面一类店相同:洋红色A是买不到粉红色C的消费者觉得‘再推求其次的情况下最容易勉强接受的一个颜色’,然后买下,个性强的消费者,直接摔门走人不买了。
只不过,因为鲜红色B和粉红色C都是比较小众的颜色,只在某些特定地段的门店畅销——比如假设鲜红色B只在相对高龄的社区贵妇人中间流行,而粉红色C只在女中学生聚居区流行。所以它们被生产出来之后,在整体市场销量上,始终不如中庸的、各个阶层都勉强可以接受的洋红色A那么畅销,才导致了迪奥公司误判,做出了一系列的自杀式市场调整。”
顾莫杰顿了顿,继续喝点茶等陆文君消化,然后抛出了观点部分。
“从这个例子来看,洋红色A根本不是喜欢的人最多的东西,它只是‘大部分消费者在没法找到最爱的时候,勉强能接受的一个也不太坏的替代品’,也就是一只勉强能顶一顶的备胎。
没有个性的消费者,可以容忍用备胎;个性强、自我意识高傲的消费者,直接就抛弃了迪奥。所以后来迪奥的英国区口红销量下降了,他把所有有个性不妥协的消费者都逼走了。
这个例子,充分说明了‘流行引导型消费’最终会让整个品牌的市场占有衰落的特性,也说明了在‘前大叔据时代’市场分析和调研工作的短板——
如果迪奥公司的市场调研人员,有足够的精力采集足够细密的数据,不仅一月一统计,而是每天一统计,他们是可以避免这个悲剧的,他们是可以看到‘在洋红色A卖完之前,已经有别的颜色先被卖完了’这个事实的。
凯文阿什顿当年提出‘物联网’的空想时,认为‘未来有没有可能到某一个时代,数据联网芯片足够廉价、廉价到给每一箱口红上都嵌入一个简易芯片,可以跟踪采集这箱口红什么时候被卖完、具体流向什么客户’之类的数据。
物联网当然不只是实现这么简单弱智的一个功能就行的,这只是18年前的古人对物联网最初用途的一个原始构想。但是其背后蕴含的道理,我们今天的人依然可以借鉴。
比如,我们和腾讯争夺经营的互联网内容产业。”
顾莫杰说到这儿,略微停顿了一下,似乎是在考虑,究竟拿哪个行业的情况来举例子。
它可以选电影、音乐、游戏,相对而言,游戏最能说明问题,但还不够通俗。犹豫再三,他还是准备用一个腾讯已经开始经营、而初音还没有介入的内容领域,作为切入点举例。
“这样吧,我们用网络文学来举例好了——腾讯已经经营了一个叫做创S的网文网站,咱初音还没经营网文,但是,网文的运作原理、市面行情,我稍微找行家了解过一些。
打个比方,现在市面上作品最红最大卖的网文写手,被圈子里人称为‘中原五白’。中原五白中有些在马化腾建站的时候被挖过去了,他们的作品在各大最好的推荐位上经常可以看见。
那么试问,中原五白的书是最好看的么?不见得,稍微有点品味的读者,大多以‘辣鸡、小白文’嗤之以鼻。但是仔细研究一下他们的文章,可以发现那些作品都是‘不求在大多数目标付费人群眼中成为10分神作、只求在尽可能多的覆盖人群里达到8分的付费阀值’这种状态的——我们假设在读者心目中达到8分,是导致其是否付费的一个门槛阀值。
好,这种情况下,我们会看到什么?中原五白写的书,主角往往定位比较模糊,不描写主角高还是矮,胖还是瘦,最多稍微写一下是帅还是丑,但是绝对不明显。
这样的模糊处理,按说会让每个读者的代入感都不完美,帅的读者觉得主角怎么不帅?怎么不突出主角依靠帅的特性金手指开挂?高的读者也会有同感,他们在现实生活中因为身高优势把妹求职都有便利,书中主角却没有。
可为什么中原五白还是坚持这么写?因为他们知道,如果让主角利用高帅开挂,那么矮丑的读者就有大概率弃文,不爽,不给钱。所以,他们并没有试图写一个让任何读者完美的作品,他们只是想写一本‘在任何读者眼里,都像迪奥的洋红色A口红那样,能让人凑合着掏钱’的作品。