2015年9月10日,腾讯财经上发布了一条题为《8月CPI涨2%创12个月新高》的新闻。这条新闻的内容好像和媒体记者的日常新闻稿一样,引用了统计局的数据,并加入了国家统计局城市司高级统计师余秋梅和银河证券等分析师对数据的分析预测。但背后的作者其实是腾讯金融发展的稿件。机器人梦想作家.
"机器人去抢记者的饭碗!”“记者们已经哭晕了”...写作。机器人一时间引发业内热议。
远程写作机器人DreamWriter发表第一条新闻已经一年半了,媒体已经像CBN的“DT稿王”和新华社的“快写小创新”了。机器人开始参与写作工作。
DreamWriter项目副总监刘康透露,目前金融、科技类应用稿件数量超过2000篇/天,体育类稿件数量为500篇/天,包括每日报价和列表。公司公告集锦,以及每轮体育赛事新闻。
不仅如此,据了解,基于书写,机器人腾讯内部一款整合新闻资讯AI和超级资讯服务秘书的应用正在开发中。
机器人这种“写作”
我开发手稿的原因是机器人来自腾讯自身的“痛点”。
刘康向记者回忆,当时他所在的腾讯财经频道招聘了一批新人和实习生,大量的基础工作、速稿、财务报告、宏观数据变动、板块变动都需要速稿,对新人来说枯燥又辛苦。“所以大家都在问机器能不能做到,让我们这些有创意的新人能把精力留下来,做更多有创意的事情,这是我们做这件事的出发点。”
因此2014年12月规划建立数据库,2015年3月正式上线。机器人写作项目,经过半年左右的开发和测试,腾讯写了稿子。机器人DreamWriter于2015年9月正式上线。
刘康告诉记者,其实DreamWriter的团队只有5个人,但腾讯很多部门都参与到DreamWriter的工作中,参与建设和底层支持。
在过去的一年半时间里,这个团队一直在低调运作。刘康告诉记者,DreamWriter一直在持续工作,特别是奥运会期间,DreamWriter已经产生了3600多篇文章,其中第一枚金牌的新闻是机器人是写好的。
起草机器人梦想作家,你到底是怎么写新闻的?
刘康说,从文字的角度来看,实现从0到1的机器书写是比较简单的。比如用一个技术团队简单的做一个财务报表系统,或者做一个体育赛事的基本描述,这样的模块化写作,但是如何从1到3呢?机器人稿子写得很有“人情味”,细节比较到位,很精彩,耗费了很多精力。
以写潜水新闻为例。这是一场得分比赛。评委对每一个动作的评分,如走板、空中姿势、下坠姿态、水花,都有详细的数据记录在数据库里。接下来,这些数据会被腾讯通过一定的算法和机器本身进行识别——先让机器运行几十万条数据,运行一个规则,它会自己还原这些数据。因为每一个分数都可以还原为一个动作,所以通过一定的算法还原到原场景是可行的。
刘康提到,其实竞争对手也有非常聪明的稿子机器人但对方的做法是抓住直播间的描述,通过一定的算法和逻辑拼接成一篇文章,而腾讯写稿子。机器人DreamWriter则不同,它是基于特别细粒度的数据进行还原的。
“今天的数据量非常精细,精细到可以描述每一个数据的粒子缩减。”刘康说,“比如如何在数据库中记录足球的动作,射门包括射门、击中立柱、高出立柱...这些都可以通过数据还原。”
在写手稿的时候机器人背后的核心技术主要涉及智能写作技术、内容抽取技术和新闻抽取技术。目前,腾讯已经获得相关专利。
以内容抽取的技术为例,DreamWriter可以将一个千字的章节概括成几百个字,这涉及到统计、深度学习等技术。在财经领域,写文章机器人更依赖于统计,但在其他内容领域,腾讯可能需要单独开发算法产品模型。
此外,对于写作机器人对于写出来的稿子,腾讯设立了专门的安全管理平台来控制内容风险:第一轮会单独做一个算法和规则,判断机器写出来有没有问题;第二轮是安全审计;第三轮不会正式启动。它们之间的时间越短,工作就越准确和快速。
做一个和标题相反的产品。
刘康向记者透露,目前DreamWriter在财经、科技、体育等领域的常规写作和批量写作已经开发出来了。机器人在未来一年甚至更长时间内,工作重点主要是持续优化文本,将内容生产领域从目前的科技、财经、体育拓展到所有品类。
比如财经新闻写作领域,现在的写作。机器人它有很强的算法规则和模型,但并不难,尤其是在对数据的解读和认知甚至是对未来的预测上。刘康坦言,如果想让DreamWriter写得更有深度,甚至想在未来写行业调研报告和一些垂直的深度调研,还是需要花更多的时间在上面。
在刘康看来,写手稿机器人我不想抢记者的饭碗,但我希望DreamWriter能解放记者,让他们从事更具挑战性和智慧的工作。“远不是取代(记者),我希望它永远是个助手,帮我整理信息,然后我赋予它生命。”
接下来,DreamWriter团队希望推出一款结合新闻和信息AI以及超级信息服务秘书的App。
从记者的体验来看,这款代号为“DreamRead”的App兼具听书和阅读功能,集语音交互和文字阅读功能于一体。所有内容均来自DreamWriter撰写的实时新闻简报和新闻精华。
他提到国外一个关于实时快新闻的App。“我几乎没打开过,但是会推送到通知中心。我大概一眼就知道了。从DAU的角度来看,并不多,因为我没有打开过,时间更长,但对我有用,有帮助。我们是一样的。我希望不要使用这些标准。只要能帮到你,我们就认为是好产品。”
除了提供个性化信息,腾讯还希望将DreamRead扩展为一个集天气、汽车、娱乐、科技、重大政策、资产管理等诸多场景于一体的服务平台。“比如我可以推最近买的股票,投资基金亏了。多少钱;再比如最新的房地产政策。比如我买了学区房,会提醒你最近房地产政策频繁,要注意资产安全。"
但目前来看,这款专注于个性化信息生产和服务的App还需要时间打磨。刘康表示,推出时间表尚未确定,不排除产品结构会有较大改动。