AIProCon在线大会笔记之阿里达摩院司罗:为商业搭建语言桥梁

    技术2025-06-26  16

    AIProCon在线大会笔记

    为商业搭建语言桥梁自然语言处理翻译技术平台NLP自学习平台语言模型 总结

    AI学习与进阶实践 智慧教育 AI创业与投资 AI行业新趋势 计算机视觉技术与实践 大数据与AI中台 语音语义技术实践与应用

    为商业搭建语言桥梁

    阿里巴巴 达摩院 语言实验室 司罗

    自然语言处理

    自然语言智能研究实现人与计算机之间用语言进行有效通信,融合语言学、心理学、计算机科学、数学、统计学于一体的科学,涉及到自然语言和形式化语言的分析、抽取、理解、转换和产生等多个课题。 自然语言处理是实现完整人工智能的必要技术。

    自然语言智能趋势深度语言模型突破式发展,引领重要自然语言技术取得进展共有云NLP技术服务从通用功能走向定制化服务自然语言技术逐步与行业/场景紧密结合,产生更大价值

    翻译技术平台

    阿里机器翻译技术

    NLP自学习平台

    背景:NLP需求多而杂,场景化、行业化有高度的定制依赖,很多数据有高度的隐私,而且缺少平台化的解决方案。定位:面向零算法基础用户的定制化标注、训练、预测的一体化服务平台。优势:易用(流程简单)、快捷(训练一个简单模型仅需半个小时)、专业(众多数据抽象模型)、成本低(私有化部署) NLP自学习平台-示例

    语言模型

    语言模型:描述自然语言的表示,顺序,结构,意义,生成的过程,以及如何使用与语言相关的应用语言学习法:使用语言学文法(如上下文相关文法)来描述正规的语言表示形式和意义–新语言,新语法,新意义在不断的变化和涌现,纯规则的方式局限性大。数据驱动方法–统计学/深度学习。通过大量的语料和一些相关应用任务,学习语言的表示和结构–利用海量的语料信息自学习,适用于广阔场景和应用 预训练语言模型-StructBERT 预训练语言模型-融合结构化信息 预训练语言模型-排序、机器阅读理解 自然语言智能数据知识、技术、场景迭代 电商翻译业务场景 钉钉翻译服务 地址信息管理系统 事件分析 泛通信 智能司法 智能合同 智慧医疗

    总结

    构建阿里巴巴自然语言技术体系,支撑阿里经济体语言技术和应用赋能合作者,发展普惠的自然语言技术创新自然语言技术,探索未来智能
    Processed: 0.012, SQL: 9