章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。
吴云霞被他逗得捂着嘴轻笑起来。
叶伟航看她一眼,
辅导员师姐情绪有波动,
但是,
系统没有反应,没有源点。
叶伟航更加确认,
这小会议室里提供源点的人就是祝闲云了。
指了指下一个方框:
“所以,我们需要通过数据公司购买,自己人工筛选一些标注过的文本数据。也就是所谓的良好规范文本数据,喂给完成第二步的模型进行下一轮的训练——正常的监督学习训练。”
“在第三步监督学习之后,只要模型得到较好拟合,我们就得到了一个现在在全世界都遥遥领先的聊天机器人。这时,如果提问他认知范围之外的问题,他在大多数情况之下,都不会骂人,也不会瞎编,而是会给出自己认为正确的回答并提示:这是他的猜测,可能和事实存在差距。”
“但是,我刚才提到了我们的目标,绝对不是拿个NeurlPS大会的一等奖就满足了。”
“在监督学习阶段,我们还可以通过一些小小的细节操作,把他的能力进一步提升。”
“还能怎么提升呢?”
吴云霞觉得作为一个聊天机器人,能够完成刚才叶伟航描述的那些任务已经达到了她想象力的极限了。
叶伟航在白板上,【P3监督学习】的方框右边又画了一个小方框。
在方框里写下了【非对话文本数据】五个字。
“我们可以在监督学习阶段,通过喂人工标记的其他文本,让这个聊天机器人不再只是一个聊天机器人。”
“喂给他海量科学论文的内容,他就能写出论文。”
“喂给他海量小说的内容,他就能写出小说。”
“喂给他海量的剧本内容,他就能自己创作出剧本。”
“唯一需要的,只是在这些文本内容之前,加上一个对应的问题作为标注引导:你能写出一个xxx的论文/小说/剧本吗?”
小会议室里所有人都听得目瞪口呆。
祝闲云只感觉自己头皮发麻,好一会才发出了灵魂拷问:
“你这……还是个聊天机器人吗?”
【源点+0.01】
……
叶伟航看着系统面板上跳出来的提示,连连点头:
“当然啦,聊天机器人只是个开始而已。”
“我们要在这个在大会上展示的产品基础上研发出更多,更有现实意义的产品。”
“自动写作,自动论文生成,自动洗稿这些基本的刚才我都说过了。”
“我们都知道千度搜索现在仍然在使用那一套关键词匹配的算法,这让用户大多数时候只能搜索到一堆自己根本不感兴趣的广告,未来我们完全可以把聊天机器人的算法卖给千度,让他们能稍微接近一下谷歌的搜索产品水平。也许未来有一天,我们真的能让千度走向世界,取代谷歌的市场份额呢?”
“大家可以想象一下,如果欧罗巴,亚美利加,瀛洲,三哥,大多数普通人,在几年以后搜索用的不再是雅虎,谷歌,而是千度……”
这饼画的,
吴云霞看向叶伟航的眼神都变了。
祝闲云已经不止头皮发麻,
他现在感觉自己全身都在发抖,简直比第一次评教授的时候肾上腺素分泌得还多。
这小子,
怎么感觉口才和画饼能力比当年的丁三石还厉害啊。
难道,