在模型能力趨同的當下,真正的競爭壁壘是什么?
科大訊飛交出最新答卷:讓AI更懂你。
怎么個更懂你?拋開相關定義不說(下文揭曉),在第八屆世界聲博會暨2025科大訊飛全球1024開發者節現場,我們看到了兩個非常直觀的例子:
這不,人剛踏進展館還不知道看啥,門口的多模態超擬人“小飛老師”就來幫你劃重點了,而且還能幫忙推薦合肥的特色景點和美食等。
(小飛老師)我覺得這次展會上最值得關注的是訊飛星火大模型的全新升級……
視頻鏈接://mp.weixin.qq.com/s/FcyHqy6D9q_T7FgeI2QogA
而當你逛完展想發個朋友圈,科大訊飛AI也知道如何讓你脫穎而出了(doge)。
僅需一句話,其「百變聲音復刻」功能就能讓你輕松掌握日英法等多國語言,以及天津話四川話等多地方言。
而且玩法多樣,任意音色、任意風格都能解耦組合~
毫不夸張的說,對比真人提供的聲音,這個功能泰強辣(連衣服和背景圖也一并換了):
視頻鏈接://mp.weixin.qq.com/s/FcyHqy6D9q_T7FgeI2QogA
看到這里想必你也感受到了,所謂的“更懂你”其實就是“需要的時候它在,不需要時則安靜陪伴”——一種恰到好處的默契與懂得。
而這,正是科大訊飛為AI設定的新命題。在人類的成長、工作、溝通與生活四個維度中,AI應理解人類的不同追求。
也就是說,AI進化的方向不再只是變得更聰明,而是能真正“讀懂你”。
為此,科大訊飛率先出擊,進行了一系列硬核技術突圍——
包括發布全新升級的訊飛星火深度推理大模型X1.5,以及在多模態交互、軟硬一體化等方面取得關鍵進展。
值得注意的是,這些通通都是在國產算力平臺上實現的,英偉達含量為0!
總之,透過這場發布會,我們已經能真切感受到:當一些廠商仍在“卷參數、卷規模”時,訊飛已率先駛向了“更懂你”的國產AI新賽道。
AI紅利兌現時刻,已然開啟。
訊飛星火X1.5,依舊全國產
正如發布會上所說,這幾年大模型領域競爭如火如荼,比拼的就是規模和能力——誰的模型更大、更強、更聰明。
日新月異的新模型新版本、層出不窮的基準測試……技術至上、性能優先是AI起步階段最鮮明的特征。
但隨著技術門檻逐漸被拉平,AI行業掰手腕正在從單純的能力battle轉向吸引用戶選擇。于是長期深耕行業場景的訊飛率先提出了自己的應對之策:做更懂你的AI。
具體來說,就是在傳統AI能聽能說能算的基礎上提出了更高要求,強調不僅要懂語言,更要懂情緒;懂任務,更要懂意圖,讓每個人的價值都能因為AI實現無限放大。
在技術力發展的同時,更注重技術與用戶體驗、場景落地的結合,比如:
教育:AI教師在傳道授業解惑以外,還要理解每個人的學習潛力,提供因人而異的成長路徑。
工作:不只是執行命令,AI助手要理解每項工作的深層邏輯,還要會分解任務步驟、實時管理流程。
對話:AI生活搭子要通過語氣與語境,深入探索人類每句話背后的含義。
生活:AI要成為你的專屬家庭醫生,全天候關注你的身體與生活規律,會主動提醒、守護與陪伴。
而這也是此次星火大模型升級的重中之重。
星火大模型作為訊飛AI架構的底層基石,按照慣例,每一次升級,都有著顯著的能力躍遷。
全新發布的星火X1.5大模型,以全棧國產化技術為基礎,帶來了更強的邏輯推理和任務分解,理解力Max、能力Pro~
首先模型實現完全自主可控,一是算力自主,模型的訓練和推理過程完全基于全國產算力平臺,不依賴英偉達等海外GPU廠商;二是技術自主,整個模型框架均由訊飛自研,構建起特有的研發生態。
同時在技術層面突破國產算力的限制,攻克了長思維鏈強化學習算法的高效訓練問題。
眾所周知,大模型在回答復雜問題時很容易中途跑偏或邏輯斷裂,而長思維鏈則讓模型能夠像人一樣一步步拆解問題,從而讓整個推理過程更連貫、穩定。
而且訊飛直接將深度推理訓練效率從原來的25%提升至84%以上,這意味著模型推理更連貫、更能理解復雜任務,比如在星火X1.5上處理這樣一個數學邏輯推理題:
Prompt:一個外星人來到地球后,第1天有相等的可能選擇以下四件事中的一件完成: 1、自我毀滅; 2、分裂成兩個外星人; 3、分裂成三個外星人; 4、什么都不做。 此后每天,每個外星人均會做1次選擇,且彼此之間相互獨立,求地球上最終沒有外星人的概率。
嘶,聽起來頭都大了……(最初只有OpenAI o1專業版才能做對)
結果星火X1.5唰唰唰就給出了解法:
視頻鏈接://mp.weixin.qq.com/s/FcyHqy6D9q_T7FgeI2QogA
仔細看它的思考過程,每一步都與人類解題步驟吻合,不僅會告訴用戶每一步是怎么來的,也會具體闡述為什么這么做,真正做到有理有據。
尤其在面對復雜任務時,星火X1.5能夠動態調用最匹配的專家模型,輸出更精準、更具邏輯性的結果。
而且要知道,這些可都是在國產算力下完成的!!!(重要的事情說三遍)
其次,星火X1.5全面升級六大核心能力——語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力,比肩國際一流大模型。
就以數學能力為例,專業評測基準輕松拿下,實際測試任務也是so easy:
與GPT-5 (high)、Gemini-2.5-Pro D、DeepSeek V3.2-Exp、Qwen3-235B-A22B等國內外主流模型同臺競技AIME 2025數學競賽,星火X1.5直接登頂第一。
而這背后,正是星火X1.5在模型架構上的全面升級——采用MoE架構,并實現快慢統一思考。
模型總參數量為293B,比原來縮小一倍,推理激活可僅30B,而且只需要一臺昇騰標配服務器就能部署,推理速度相比X1提升100%。
另外,發布會上還同步推出了全球首發的非自回歸語音大模型架構。
相比同尺寸的自回歸語言模型,語音識別效果可相對提升16%,推理成本下降520%。
這也就意味著訊飛在模型上的升級不僅僅是簡單的參數堆疊或模型微調,而是在底層架構創新和訓練機制上確實取得了實質性突破,才能影響推理效率大幅度階躍提升。
星火X1.5還首次推出記憶功能,可從多次交互中累計理解用戶的偏好與知識,自動篩選與提煉語義特征、動態地修正舊記憶、整理零散信息,從而生成更貼合用戶習慣的回答。
支持130+種語言,整體性能可達到GPT-5的95%,全新升級2.0版本的星火語音同傳大模型更是在國際數據公司(IDC)8項評測中均登頂行業第一。
可以說,以智能語音起家的科大訊飛,得天獨厚的優勢讓它在大模型語言理解上卷到飛起。
而在理解之外,訊飛的另一場“交互”革新也在同步進行。
如果說大模型是AI的大腦,那么多模態交互就是它的感知系統,訊飛率先意識到,當二者融合,AI才能真正從語言智能走向世界智能。
畢竟“理解”只是起點,“共情”才是方向。
AI交互邁入“共情時代”
過去的AI交互,只擁有基礎的語音識別和指令執行,比如當你對象說:
你走吧,走了就不要回來了。
機械的AI識別出指令并頭也不回地走掉,Game Over……
這就是現在AI的通病,無法根據語氣、表情或身體狀態給出正確的回應,缺乏情緒感知,而訊飛要解決的,就是讓AI像人一樣讀懂對象的言外之意(doge)。
而且一上來就挑戰最高難度——多人、遠場、高噪的復雜現實場景。
麥克風遠場識別上,具備5米0dB遠場高噪語音識別能力,在嘈雜環境中也能有強大的語音識別表現。
在多人交互時,可以即時溝通、實時打斷,不會被無關聲音(如背景音或突然插入的咳嗽聲)所影響,而且可以精準識別并回應每一位的交互。
虛擬人形象也能根據交互對象的說話,完成視覺跟隨,側頭給人更強的交互感,同時在語音合成效果上支持數十種副語言,語氣也更靈活自然。
能做到多個類型個性化特征的雙向記憶管理,也能連續通過多輪的共情交互解析對方的情緒變化,給出更加貼心默契的回應。
簡而言之,在多模態交互上,新升級的訊飛AI擁有更為強大的跨模態理解能力,不僅能聽得準、聽得懂,還能說得像、記得住,懂你所思、想你所想。
這標志著AI交互從冷冰冰的語音助手轉向有溫度的智能伙伴,真正從理解語音進化到理解人。
與此同時,這種交互能力也正在與訊飛的軟硬件生態優勢深度融合。
比如前面提及的遠場聽覺降噪,只靠算法是遠遠不夠的,還需要麥克風陣列輔助;視覺方面,通過視覺攝像頭實現3D視覺的物理世界感知。
再將視覺和聽覺融合理解,這就是訊飛打造出的軟硬一體的多模態交互系統。
在發布會現場,這種一體化趨勢則更為明顯,訊飛一籮筐的新品上線就是有力印證:
訊飛AI辦公本
訊飛智能辦公本X5首創上4下4環的八麥克風陣列,能夠360度聲源定位,高噪遠場識別效果遙遙領先iPhone 17 Pro。
海外上市的AINOTE2更是機身薄如蟬翼,只有4.2mm。
什么概念呢?吉尼斯官方認證“全球最薄墨水屏平板”,大概兩枚硬幣的厚度。
這幾乎是把能壓縮的全壓縮了,電池用的也是業界首屈一指的超薄高壓電池,而續航能力也被延長到了超超超久的113天,是更適合牛馬打工人的一款會議紀要神器嗷~
訊飛雙屏翻譯機2.0
新增強降噪模式能在一米以內智能聚焦說話者聲音,就像在他周圍建立了一個密不透風的隔音墻,外界紛紛擾擾,只有說話者的聲音倏爾不動。(咳咳)
相比原來的1.0版本,尺寸更大、機身更薄、續航更久、內存更大、像素更好……還在原有的16大專業領域翻譯的基礎之上,新增了教育一欄,語音識別率高達98.69%,性價比滿昏!
訊飛AI翻譯耳機
首創單耳三麥多感融合降噪系統,可實現骨導和氣導信號同時采集。
在地鐵等極端嘈雜環境中仍然可以保持識別準確率高達97.1%,上班通勤好物又喜加一。
訊飛同傳麥克風
可實現2秒低延遲語音播報、10種語言翻譯實時切換,搭載110度超心型麥克風,滿足信噪比大于等于72dBA。
也無需擔心數據泄露,加密存儲這塊,訊飛先人一步。
車載音效系統
iFLYSOUND全鏈自研聲學系統擁有自研的30+全鏈路聲學算法,能讓每個人都能享受到百萬級豪車音響的聽覺體驗,帶來更沉浸、更智能的AI交互。
訊飛AI黑板
訊飛AI黑板可以讓聲音均勻分布到教室的每個角落,即使是最后一排“摸魚”的同學也能聽清老師的小發雷霆(bushi)
每個位置都是最佳C位觀景點,還有防藍光設計。
這下,麻麻再也不用擔心我上課不認真嘍。
科大訊飛AI學習機
現在的AI學習機更像是一位全能的孩子守護者。
不僅護眼更友好,還可以實時檢測孩子姿勢,提醒孩子及時調整,全方位保駕護航孩子的身體健康。
……
從會議室到車內,從課堂到家庭,訊飛正在用這些軟硬件一體化AI設備改變人們的交互方式,讓AI從數據層理解世界走向真實的物理世界,構建起無法被替代的技術護城河。
其核心競爭力,不在于模型比別人大,而在于它能夠讓模型理解更廣、落地更深。
因為訊飛始終相信,當AI擁有了情感理解與真實交互的能力,它就不再只是通用工具,而是每個垂直場景中人類的新伙伴:一個更懂你的AI。
留給訊飛AI的行業,不多了(doge)!
如果說軟硬一體在特定場景中構筑了難以復制的“體驗壁壘”,那么,當這種能力與海量的行業知識與數據相遇,AI便從“好用”的工具,進一步升維成了“懂行”的專家。
而就在發布會現場,訊飛AI賦能千行百業的系列成果也得到了集中展示。
醫療方面,得益于底模推理能力升級,其星火醫療大模型的綜合實力也再次提升。
尤其在門診/住院場景的診療能力上,該模型取得了關鍵突破——
面向等級醫院的專科AI能力首次達到主任級醫師水平。
基于此,科大訊飛還首次發布了智醫助理醫院版1.0,能輔助診療、輔助會診、病歷生成與病歷質控。
你以為這就完了?NoNoNo,針對醫療診斷的“最后一公里”——日常健康管理,科大訊飛同樣持續發力。
全新升級后的全民AI健康助手“訊飛曉醫”這就上桌,這一次,人人都能構建更完整豐富的個人健康檔案。
它不僅能自動整合多來源健康數據,生成覆蓋170種細分標簽維度的個人健康畫像;更能動態追蹤健康變化,展現疾病的發展趨勢,讓用戶一目了然地掌握健康狀況與發展方向。
至此,從醫院的專業診療到家庭的日常健康,科大訊飛已構建起“AI+醫療”的完整服務閉環。
當然除了醫療,科大訊飛在其“老本行”教育領域更是鉆研頗深。
僅以智能批改這個小細節為例,它就已經從“批對錯減負”邁向了“步驟級錯因增效”這一新階段。
據介紹,由訊飛首創的錯因標簽體系,在智能批改過程中可完成3大類、3層級、4000+錯因溯源。其解答題分步驟批改及錯因診斷水平已超普通老師,首次邁過產品實用門檻。
具體打開方式be like:
先用星火智能批閱機掃描試卷,然后AI立馬進行一鍵批改,批改結果會詳細顯示錯誤原因(這里就用上了三級錯因體系),最后批閱機甚至能在原卷上留痕打印出一份帶詳細批注的試卷。
借助這種軟硬結合的方式,作業批改準確率不僅更高,而且用時更少了——以前老師改一個班需要60分鐘, 如今借助最新星火智能批閱機(AI+人工)僅需10分鐘。
而在醫療教育之外,工作場景和日常家用場景科大訊飛也沒落下。
發布會上,訊飛智能辦公本X5不僅能識別每個人的特質(如習慣、口音、筆跡、周邊人等),還能根據需要智能發送郵件、日程動態管理等。
另外手寫紀要和AI紀要還可以深度融合,手寫的會議要點會在最后生成的紀要中強化展現,更貼合用戶的記錄需求。
搭配總用戶數超9800萬的AI語音記錄助手訊飛聽見APP,整個工作場景也變得“更加懂你”。
此外,針對大眾消費品“車”,訊飛還發布了星火智慧座艙2.0。
這套系統具備多維感知與交互能力,力求從多個層面實現“更懂你”:
懂車環境:融合13路攝像頭全景感知周圍,提前預警路況;
懂車能力:精準控制2000多項車輛功能,孩子休息時自動開窗;
懂你意圖:語音識別準確率超95%,每個指令精準響應;
……
此外,訊飛還推出了新產品“AI星朋友”——憑借4.35MOS的高保真聲音和160多種人設模型,她能通過持續學習越來越懂你,甚至會在你需要時主動來電。(科幻電影《Her》走進現實?)
總而言之,基于其不斷打磨的AI技術,訊飛多年來已持續賦能教育、醫療、金融、汽車、城市、運營商、工業等行業賽道,而且無論是在C端還是B端,均呈現出“全面開花”的姿態。
以及這還沒結束,各種新興領域與傳統行業的深度融合式創新,也正層出不窮。
前者如AI for Science,比如最近科大訊飛聯合團隊就有一項成果登上了核聚變領域頂刊《Nuclear Fusion》,他們提出的PaMMA-Net模型,為AI賦能聚變等離子體領域提供了新方案。
后者如AI在傳統司法領域的創新,例如在長沙市岳麓區人民法院,依托訊飛打造的“無書記員庭審模式”,他們在一起房屋租賃合同糾紛案中,以AI全程錄音錄像與語音識別全面承擔了傳統書記員的工作內容。
咳咳,誰看了不說一句,這下留給訊飛AI的行業確實不多了(doge)。
不止是“秀肌肉”,更是對人機關系進行重新思考
而透過以上發布,科大訊飛為各行業提供AI落地的方法論也越來越清晰——
自主可控、軟硬一體、行業縱深、個性化。
自主可控:打造以全國產算力為訓練基座的通用大模型,獨立具備全鏈自研能力。
軟硬一體:通過將自研算法與專用硬件深度整合,訊飛打造出AI學習機、智能辦公本等終端產品。
行業縱深:結合行業數據和專業知識,AI真正落地在教育、醫療、金融等專業領域,從原來的泛用智能轉變為懂行的專家。
個性化:讓AI根據對象的特征偏好,提供因人而異、因企而異的智能服務。
其邏輯在于,“自主可控”是技術根本,“軟硬一體”是技術表現,“行業縱深”是能力落地,“個性化”是用戶體驗。這四點共同構成了智能時代的核心競爭壁壘——既要掌握底層技術,又要深入應用場景,更要真正懂用戶需求。
彼此之間環環相扣,最終勾勒出訊飛AI從技術能力走向產業價值的現實路徑。
當然,這條路上不只有訊飛,其背后所依靠的是整個生態。正如董事長劉慶峰在現場所說:
唯有生態繁榮,才有人工智能的大未來。
而提到訊飛的AI生態,開發者無疑是其中最重要的一環。
數據顯示,星火生態開發者在短短一年時間里已經增長200萬。這當中,新型智能體開發者更是強勁成長為增長主力。
面對這一趨勢,訊飛即日起還面向開發者,正式發布并開源首個原生支持RPA的智能體平臺Astron,致力于打造全球創新引擎。
與此同時,這場發布會帶給我們的,還遠不止于此。
表面上看,這好像是科大訊飛AI實力的一場“肌肉秀”,但實際上,它可能已經為AI紅利兌現指明了方向——
卷模型卷參數之后,如何讓AI“更懂人心”正在成為破局關鍵。
就像科大訊飛所展示的那樣,AI可以替醫生撰寫病歷、替老師批改作業、替司機分析路況、替同事整理會議紀要、替老人記錄健康、替孩子緩解焦慮……它安靜地出現在每個微小而真實的日常場景中。
在這些時刻,智能不再是抽象的算力堆疊,而是能感知、能響應、能共情的“更懂你的AI”。
而這,或許也正是科大訊飛將此次活動主題定為“更懂你的AI”的核心原因——
技術終將不斷進化,但真正改變世界的,不是更強的模型,而是更懂人的AI。
當AI真正“懂人”,智能也就有了溫度。

全部評論 (0)