报告简介:随着人工智能技术的发展,智能口语对话技术逐渐成为物联网时代的人工智能入口,自从2022年11月ChatGPT发布以来,以大型语言模型(LLM)为代表的对话式人工智能技术受到了学术界和工业界的广泛关注,影响到了社会生活的多个方面。本报告将对对话式人工智能技术进行介绍,同时结合思必驰自研的语言大模型DFM-2,针对产业化落地中的问题提出一些解决方案和案例。
科大讯飞 熊世富
个人简介:熊世富,科大讯飞AI研究院副院长,毕业于中国科学技术大学语音及语言国家工程中心。研究领域主包括语音识别、声学前端、自然语言处理,在科大讯飞主要负责语音转写&语音交互类语音技术的研究和技术落地工作,先后成功研发基于LSTM的语音识别系统以及端到端语音识别系统,在业务中大规模落地使用。
报告题目:大规模语音应用中的落地思考
报告摘要:AI技术的非标准化和定制化需求一直是AI落地过程中不可逃避的问题,伴随着智能语音在各行各业中的大规模渗透,各种问题层出不穷。本报告将站在讯飞语音业务的视角,首先分享我们对于如何做好大规模语音落地的思考,然后是大模型对语音的影响,以及应对方法。
报告简介:本报告首先简要介绍智能语言学习的研究背景及行业应用;然后聚焦语音评测,介绍面向语音评测的智能语音关键技术;最后展望基于“海河·谛听”大模型的新一代语音评测前瞻技术。
海天瑞声 郝玉峰
2023年第十八届全国人机语音通讯学术会议 工业论坛日程 时间:2023年12月8日 |
||||
序号 |
时间 |
报告题目 |
报告人 |
分会主席 |
1 |
16:30 - 17:00 |
对话式人工智能技术及其产业应用 |
樊帅 思必驰 |
张超 |
2 |
17:00 - 17:25 |
OPPO小布助手的语音技术应用实践 |
田垚 OPPO |
|
3 |
17:25 - 17:40 |
魔搭语音和音频多模态大模型研究和开源进展 |
张仕良 阿里云 |
|
4 |
17:40 - 17:55 |
智能语音技术赋能语言学习 |
王龙标 智言科技 |
|
时间:2023年12月9日 |
||||
5 |
18:30 - 19:00 |
大规模语音应用中的落地思考 |
熊世富 科大讯飞 |
刘瑞 |
6 |
19:00 - 19:15 |
大模型时代的语音技术发展 |
郝玉峰 海天瑞声 |
|
13 |
19:15 - 19:30 |
基于数据大模型的数据标注平台 |
周彤 标贝科技
|
注:每个报告后5分钟为提问时间