中国AI的上限有多高?
搜狗AI团队想为中国争口气。近日,搜狗AI团队连续获得两座国际型AI专业赛事冠军奖杯,AI技术硬实力尽显无遗。
在刚刚落幕的IWSLT(InternationalWorkshop on Spoken Language Translation)国际顶级口语机器翻译评测大赛上,搜狗击败了讯飞、阿里巴巴, APPTEK(美国应用科技公司)、AFRL(美国空军研究实验室)以及KIT(德国卡尔斯鲁厄理工学院)等国际国内多个强劲对手,夺得了2018年IWSLT大赛Baseline Model(基线模型)赛道冠军。
IWSLT是国际最具影响力的口语机器翻译评测比赛,从2004年开始已经举办了15届。每届比赛会吸引世界各地机器翻译领域的知名企业和研究机构参与。
在搜狗的对手中,既有讯飞、阿里巴巴等国内知名企业,也有爱尔兰ADAPT中心、美国约翰霍普金斯大学、德国卡尔斯鲁厄理工学院、芬兰赫尔辛基大学、英国爱丁堡大学、美国AppTek公司等一票国际知名大学、研究机构和公司。
比赛中,搜狗的评测任务是面向TED演讲和大会学术报告场景,测试集包括来自英国、欧洲、印度等各个国家的英语演讲者,这其中存在着噪声、口音、自由表达等复杂语音现象,同时语言中存在大量领域专有名词和口语化的表达(如:大量语气词、错误语法表达等),具有极强的实战意义和挑战性。
最终,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,证明了搜狗在口语机器翻译领域强大的实力。而搜狗、讯飞、阿里包揽前三名,更是向世界证明了中国在AI高技术应用领域的强大实力。
领跑AI赛道,搜狗在语音处理和图像处理技术上双双发力。
差不多在同一时间,搜狗在人脸识别竞赛 MegaFace的Face Identification(人脸识别)任务中,以 99.939% 的识别准确率也斩获了第一名的成绩。
在人脸识别领域中, MegaFace则是以在海量注册人脸中检索特定人脸的准确率为重要指标,是目前最为权威的人脸识别性能、特别是海量人脸识别检索性能的基准参照之一。
同时,MegaFace 数据集共包含 690572 个人员身份、1027060 张人脸图像,也使其成为全球首个百万规模级别的人脸识别算法竞赛。
一直以来,搜狗都坚持着“自然交互+知识计算”的人工智能核心方向。
依托搜狗搜索和搜狗输入法带来的巨量充足真实语料数据,搜狗能够轻松将语音识别与机器翻译技术相结合,在2016年推出了全球首款商用AI同传系统-搜狗同传,更是引领了语音翻译技术的普及与应用。
目前,搜狗同传通过数百场的国际会议“实战”,已经获得了无数媒体和观众的好评,成为当下炙手可热的“AI字幕君”。
(搜狗同传全程支持第八届浪琴北京国际马术大师赛)
而人脸识别则采用了搜狗自研的 SFace 人脸识别算法,依托图片搜索的海量图片数据资源,积累了百万级别的高质量人脸图片数据,为比赛效果的呈现提供了可靠的数据保障。
未来,搜狗的AI技术会有更长足的进步。更重要的是,搜狗的技术将会不断落地成现实,让技术便利生活、让更多的人感受技术带来的改变。