设为首页 - 加入收藏
您的当前位置:主页 > 资讯新闻 > 互联网 > 正文

阿里人工智能连破中、英文语言处置两项世界纪

来源:未知 编辑:admin 时间:2017-11-29
阿里人工智能连破中、英文语言处置两项世界纪

  日前,阿里巴巴披露了自然语言处置技巧取得的两项新成就:在全球顶级的知识库构建测评KBP2017中,斩获英文实体发明测评全球冠军;在中文语法过错主动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)三个level中全面夺得冠军,核心指标比其他参赛机构高出一倍。

  上述两项成就均来自司罗引导的iDST自然语言处置团队。司罗现任iDST自然语言处置首席科学家,曾为美国普渡大学盘算机系毕生教授。这支团队支撑了阿里巴巴内部的大批自然语言处置工作以及在阿里云上的输出。

  两场竞赛中,KBP是由NIST(National Institute of Standards and Technology,美国国度尺度与技巧研讨院)领导、美国国防部协办的赛事,重要义务为从自然书写的非构造化文本中抽取实体,以及实体之间的关系。这次测评吸引了全球20多支顶尖团队参与,包含IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ, 腾讯等。

  测评请求AI算法在“读完”一篇英文文章后,构建一个物理世界的命名实体和实体之间关系的知识库,如“克林顿和希拉里之间是夫妻关系”、“克林顿毕业于耶鲁法学院”这样一个个实体的关系。

  另一场竞赛,中文语法过错主动诊断大赛(Chinese Grammatical Error Diagnosis,以下简称 CGED)由IJCNLP联办,今年已是第四届。竞赛的背景是:学习中文的外国人数不断增添,由于中文的博大高深,外国友人在中文写作中会呈现语法过错。主办方挑选了一些外国友人写的中文作文片断,盼望参赛者用人工智能算法主动辨认里面的语法语义过错。

  因为语法纠错义务涉及到很多自然语言的基本技巧,如分词、句法剖析、词法剖析、依存关系以及语义剖析等,是对研讨机构综合技巧实力的全面考验。

  参与竞赛的技巧均来自阿里巴巴实际业务中。在阿里巴巴内部,自然语言处置技巧已经被普遍利用,每天有多达600亿次的恳求。比如,司法拍卖中AI能够依据拍卖文档抽取出汽车品牌、型号、注册日期、房产地址、小区等信息,不再须要人工填写。AI还能够读取商品阐明书后,解答顾客的一些提问。

  司罗表现:“很幸运能够同全球的同行分享阿里巴巴的研讨结果,人工智能在对于自然语言的懂得还处在起步阶段,要实现真正的语义懂得还须要 5-10 年的跨越。我们正在积极和同行业顶尖机构学习交换,推进行业发展”。

  司罗以为,自然语言处置是实现能人工智能的非常主要的一环,而且主要性会越来越浮现。感知层面的事情越来越成熟了,认知层面也得跟上了。虽然有很大的鸿沟摆在面前,但这是必需要跨越的。“因为 NLP 技巧是到达能人工智能的路上必需攻克的要害节点”。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片

Copyright © 32K8.com. 上来看吧 版权所有.本站部分内容来源于网络,如侵犯到您的权利,请与我们联系!
QQ交谈( QQ552324123)

Top