9 月 24-26 日," 2024 中国汽车供应链大会暨第三届中国智能网联新动力汽车生态大会"在武汉市举办。本届大会由中国汽车工业协会和东风汽车集团有限公司鸠合主理,以"新挑战、新对策、新机遇——推动中国汽车供应链可捏续发展"为主题,共缔造 1 场闭门会议、1 场大会论坛和 4 场主题论坛等 6 场会议,并有供应链发展施展发布、革命效果推介、香港车博会及论坛、中国汽车供应链协同革命寰宇行首站(东风汽车站)等一系列发布或配套作为。其中,在 9 月 25 日下昼举办的"主题论坛二:构建供应链重生态——激动智能网联汽车新发展"上,科大讯飞股份有限公司市集与处治有贪图部总司理祝敏发表精彩演讲。以下实验为现场发言实录:
科大讯飞股份有限公司市集与处治有贪图部总司理 祝敏
感谢协会提供这个平台,在中国汽车重镇、在东风的大本营有契机和各人相通。刚才听了张院长的共享,我深受启发,刚才罗布告长讲了汽车的内卷。讯飞处在汽车的内卷,在 AI 和东说念主工智能的内卷。我早上还在看,在我来之前,昨天和今天凌晨远隔向大模子作念了发布,Open AI 的大模子也作念了迭代,讯飞在昨天作念了一个小迭代,大的会在咱们的 1024 作念迭代。今天能有半天的时期和各人进行共享,听诸君行业大咖共享,是幸福的事情。底下我给各人先容讯飞在智能座舱的履行和的不雅点。
2022 年 Open AI 发布了 3.5 之后,引来了国内的百模大战,各人看到东说念主工智能有 3 个成分,算法、数据、算力。算法在 70 年代也曾出现了咫尺系数的算法,真是迎来大的转动是在互联网时间积存的数据,还有面前 AI 算力大边界的发展和迭代。
讯飞从创业于今一直从事 AI 和东说念主工智能领域,并不是从发布之后才作念判辨大模子,在很早之前,讯飞有一个寰宇判辨的要点实验室,Open 让各人看到大模子在这么的数据和算力的情况下,它不错收场智能线路,是以各人加大了这一块的参加。
2023 年 5 月 6 日到本年 6 月份,讯飞大模子履历 7 次迭代,张院长刚才讲到算力很贵,对讯飞来讲不仅算力很贵,讯飞莫得算力,讯飞从 2019 年以后继华为后被好意思国制裁,咱们一直在非常有限的情况下作念咱们的大模子研发。在前年 8 月份之前,咱们一直用千亿边界的参数,来 PK 别东说念主万亿边界的参数效果,在 8 月份之后华为算力卡出来,讯飞鸠合华为作念了国内首个万卡级自主算力平台的大模子,咫尺达到 GPT-4 相配的水平,当年在 1024 在 10 月份行将发布下一个版块,对标 GPT-4O。
在座舱领域,咱们一直在想大模子能给座舱带来什么变化?它的中枢价值在那儿?咱们合计在两个主见,一个是东说念主机交互,一个是场景革命,再大的模子、再好的效果用在车上是什么效果,如故要看场景。我从这两个主见先容一下讯飞的领会和想法。
借着咱们的星火 4.0,咱们对讯飞座舱东说念主机交互全链路作念了优化和诊治,领先是快,各人讲"一快遮百丑",各人看到通盘响应速率,联系于大模子没上之前,是有一个彰着的减慢,体验非常不好。咱们在讯飞 4.0 基础上作念了非常多的优化,端到端,作念到平均效应速率 1.5 秒以内,这一块的数据在捏续作念优化。另外,在多语种和方言上,让咱们用户不仅仅用豪放话,还不错用方言,还不错是多语种,你说的时候,它反馈的便是方言和多语种。厚情感多模态超拟东说念主交互,领先要看到你,感知到颜料和心情作念出对应的交互,包括超拟东说念主的交互反馈。
咱们在畅想东说念主机交互的结尾,车可能会变化一个贾维斯,变形金刚,包括轰隆游侠,什么是贾维斯式的交互?咱们合计在多模交融联接大模子的解放交互,为汽车注入类东说念主化的情感,可能是当年的主见。在前几天阿里云栖大会上,斑马的蔡先生也提到,什么时候在汽车座舱上出现 iPhone 时刻?我合计这一天细目会来,但面前还远远莫得达到这个进程,我战胜大模子会给咱们 iPhone 时刻作念助力和赋能。
除了醒目,这咱们领会这个伙伴还应该具备个性化的特征,所谓个性化,要感知面前车东说念主上的特征,联接东说念主脸感知车上是一个小孩、成东说念主或者老东说念主,给出不雷同的场景和交互。其次,要凭证使用的牵挂和民俗作念出对应的交互,包括作念一些个性化的声息追随。
联接大模子,当你问它的时候它无所不成,需要星火匡助,能给反馈。比如我可爱垂纶,问这个地点允洽垂纶吗?联接大模子,和定位,给出提议,联接多模态的大模子和定位作念的场景和应用。
下一代 AI 座舱和场景需要什么样的技巧成分?面前在云霄的大模子量非常大,在车上用的老本高,通盘调用受云霄齐集链路的影响,咫尺好多车企和咱们沿途作念端云联接,稀奇是端侧的大模子。说到端侧的大模子,咱们面前在车上的技巧平台就非常紧要。咫尺跟着国产的算力平台的发展,在算力方面也曾随机给咱们提供非常好的救援。多模态的输入和输出,在车上无论是用蓝本的触摸键交互,如故语音交互,够不上多模态的交互。
咱们在现存才智基础上作念了一些场景先容,这些场景是咱们从讯飞角度提供的提议,包括咱们作念的旅行、健康、好意思食、影视,包括车上的 K 歌,底下从以上方面作念先容。
车上的健康,咱们和车厂鸠合打造健康座舱的观念,各人知说念永久开车,包括亚健康的东说念主群,他们的健康需要额外在情,咱们想考在出行流程中如何更好督察车主的健康?咱们不错在车上作念几件事,领先是对疾病的预警,各人知说念咫尺车上搭载了 DMS 的录像头,通过无感的探伤,不错作念心律、血氧、血压、呼吸频率检测,不错检测近十种疾病的探伤;还有慢病检测,不错捏续检测,给出对应的提议。包括在一些紧迫问题出现的时候,不错问大模子,作念紧迫拯救。
随行 KTV,咫尺车上搭载 K 歌比例非常高,近一两年出现无麦 K 歌,联接车上的语音收音进行 K 歌,讯飞不错作念 AI 伴奏索要,当你听一首歌的时候,你想唱,不错去原声,也不错去女声、去男音,不错和蔡依林沿途齐唱。包括买了新车如何使用?
用车学问,包括车上的记号,故障灯亮了是什么道理?咱们不错联接多模态的感知。包括出现问题的时候,不错进行场景推选,包括给出对应的谜底。
包括千里浸式出动影厅,比如我不紧记电影称呼,不错凭证电影场景运用大模子进行百科。
讯飞提供的 AI 技巧也好,提供的应用也好,会和车企协作,以简短肤浅的口头搭载。咱们咫尺冉冉往多域交融主见走,咱们中央单位处理才智越来越强,作念逼近化,一个单位有好多协助处理器。跟着降车本,还有信息安全条目下,咱们会冉冉把好多算法,包括大模子,往土产货去放。面前讯飞是先在一个 SOC 上把全栈 AI 收场部署,包括车上用到语音的、图像的、收场的,包括音响音效,像智驾,移植到一个 SOC 上,有一些收场了量产,有一些正在和车厂鸠合拓荒当中。包括判辨大模子语音和端配合部署的有贪图,和好多车厂协作,咱们打造通盘车上的 AI 底座,助力打造智能汽车平台。
咱们在落地流程中也遭遇了好多问题,在这里抛砖,比如传统语音与大模子配合、衔尾如何作念协同?在车上土产货场景下大模子不一定有传统语音好,如何作念均衡?接入大模子后如何作念拒识?咱们在作念落地化参加了多数的元气心灵。面前有好多车厂作念探索,把语音和土产货端侧大模子、云霄大模子作念了拆分,可能是两三家供应商共同作念这个事情,除了集成的难度,还有大模子的才智强,然则要有计划土产货识别,关于土产货识别来讲,咫尺关于大模子土产货化之后瑕瑜常大的挑战。
讯飞是 1999 年建造,是中国第一家大学生创业的上市公司,有 2 个国度要点实验室。咱们的业务除了各人熟知的语音、大模子,还在作念智能音效、智能座舱,在汽车领域深耕 21 年,咫尺量产托福的车型扶持 1400 个,基本上国内的车企皆有协作,约束 2023 年年底前段搭载扶持 5700 万台,咫尺在 6000 多万台。
讯飞在中国汽车出口流程中,给国内品牌提供了多语种支捏,咫尺有扶持 23 个语种,和国内主要车企出海皆有协作。车上音响音效,咫尺作念了车上的音响音效,全栈的算法皆是讯飞自研,搭载从低端到高端多个平台,100% 的国产平台亦然在拓荒当中。在这几年的协作中取得了扶持 14 家国内主流车企 30 多个车型的定点,储存了 300 多万台的装载量。除此以外,讯飞基于国产的芯片平台,像黑芝麻、华为,作念咱们我方的智驾处治有贪图,基于纯视觉的有贪图。讯飞基于大模子在作念车企数字化有贪图,包括涵盖研发,代码助手、销售领域、客服领域、用车领域,皆有居品的袒护。
谢谢!
(注:本文凭证现场速记整理,未经演讲嘉宾审阅)