
紫東太初是由中科院自動化所和武漢人工智能研究院聯合推出的一個全模態大模型,它是在千億參數多模態大模型“紫東太初1.0”基礎上升級打造的2.0版本。紫東太初大模型支持多輪問答、文本創作、圖像生成、3D理解、信號分析等全面問答任務,具有強大的認知、理解、創作能力,能夠帶來全新的互動體驗。

紫東太初的主要功能
一、圖像能力
- 圖像描述:基于用戶上傳的圖片素材,準確理解并回答圖片識別類問題
- 目標檢測:支持豐富品類的目標檢測任務,能夠判定目標類型、數量和對應的位置信息
- 圖像檢索:基于海量的高質圖片素材庫,能為用戶搜索出關聯度高的精致圖片素材
- 圖像生成:針對用戶指令訴求,生成對應的精致圖片,并可以修改描述微調圖片內容
- 文字識別:基于圖片內容,支持多場景、多語種、高精度的文字檢測與識別服務
二、語言能力
- 中文問答:準確理解用戶輸入的問題語境,并能做出準確的知識性問答
- 文本續寫:基于用戶輸入的故事引導自動續寫豐富故事內容
- 文本創作:準確理解用戶輸入意圖,并生成語意連貫、邏輯通順的文本內容
- 標題生成:基于對文章或者長文本的理解,快速聚合生成精簡且概括的標題文案
- 語法分析:準確理解并分析中英文句子的語法,提醒語法錯誤并修改等
- 機器翻譯:幫助用戶翻譯各類型文本素材,包括中英文互譯、文言文和白話文互譯等
- 古詩創作:基于用戶給到的主題或引導內容即興創作詩歌、絕句等
- 代碼理解:理解C語言、Python、JAVA等絕大部分編程語言、算法和數據結構,快速給出所需的解答
- 代碼編寫:能幫助用戶快速編寫簡單的代碼片段,例如函數、類或循環等
- 數學計算:既能處理常規數學計算問題,也能處理如《孫子算經》上記錄的雞兔同籠數學應用問題等
- 邏輯推理:支持處理復雜的邏輯推理類問題,包括科學推理、常識推理、時空推理等
三、視頻能力
- 視頻描述:基于用戶上傳的視頻素材,準確理解并回答視頻識別、視頻描述類問題
- 視頻檢索:基于海量的高質視頻素材庫,能為用戶搜索出關聯度高的精致視頻素材
- 視頻問答:基于用戶上傳的視頻素材,準確理解并回答視頻相關的問題,同時支持上下文信息理解和多輪問答
四、音樂能力
- 音樂生成:通過給定的文本提示可控生成高保真的音樂,并支持即興創作多種風格類型和多種樂器演奏的音樂
- 音樂多模問答:基于對用戶上傳的音樂素材的理解,可完成相關多模態問答任務
五、音頻能力
- 音頻鑒偽:紫東太初能判斷當前音頻是真人說話還是機器合成
- 音頻事件分類:可檢測當前音頻中所包含的聲音事件類型,目前支持11種單一聲音事件和混合聲音事件
- 語音識別:可將語音快速準確識別為文字,支持手機應用語音交互、語音內容分析多個場景
- 語音合成:提供高度擬人、流暢自然的語音合成服務,滿足文本閱讀、語音播報等各類型場景需求
六、3D能力
- 3D場景描述:紫東太初2.0具備基于點云數據的3D場景理解和物體感知能力
七、信號類能力
- 信號識別:支持雷達信號鑒別與知識交互,可借助模型快速掌握信號基本來源及參數等
如何使用紫東太初
- 訪問紫東太初的官網(taichu-web.ia.ac.cn),點擊對話體驗
- 登錄/注冊你的賬號,申請使用登錄成功后便會自動跳轉到對話界面
- 輸入你的問題或者輸入斜杠選擇推薦提示指令(你也可以選擇內置的示例查看),然后點擊發送
- 紫東太初便會智能回答你的問題