《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 中國電信TeleChat-12B星辰語義大模型年內開源參數將達千億級

中國電信TeleChat-12B星辰語義大模型年內開源參數將達千億級

2024-04-17
來源:IT之家

4 月 16 日消息,中國電信已開源 120 億參數 TeleChat-12B 星辰語義大模型,還表示將于年內開源千億級參數大模型。

相較 1 月開源的 7B 版本,12 版版本在內容、性能和應用等方面整體效果提升 30%,其中多輪推理、安全問題等領域提升超 40%。

據介紹,TeleChat-12B 將 7B 版本 1.5T 訓練數據提升至 3T,優化數據清洗、標注策略,持續構建專項任務 SFT (監督微調) 數據,優化數據構建規范,大大提升數據質量;同時,基于電信星辰大模型用戶真實回流數據,優化獎勵模型和強化學習模型,有效提升模型問答效果。

TeleChat-12B 在模型結構、訓練數據、訓練方法等方面進行了改進,在通用問答和知識類、代碼類、數學類榜單上相比 TeleChat-7B 均有大幅提升。

在模型結構方面,使用小規模的模型嘗試多種模型結構的組合選擇最優結構。相比 TeleChat-7B 模型,TeleChat-12B 模型采用了詞嵌入層與輸出層解耦的結構,將詞嵌入層和輸出 lm head 層參數分開,有助于增強訓練穩定性和收斂性。

在訓練數據方面,收集了覆蓋書籍、百科、新聞、政務、法律、醫藥、專利、論文、數學、代碼等諸多方面的大量中英文數據;通過優化數據清洗策略大幅提升數據的文本干凈度、觀點無偏性、內容有效性、格式規范性。

在訓練方法方面,使用科學數據配比學習與課程學習的方法,使用小參數模型在多種數據配比的數據上擬合,得到對各個數據集難度的先驗估計;訓練過程中每隔一段時間自動化評估當前模型在所有數據集上的 loss,以及在評測集上的生成效果,動態提升較難學習的數據集權重,保證模型在各個數據集上都有較佳的擬合效果。

中國電信表示,此次開源提供基礎模型以及基于相應版本的對話模型、不僅支持傳統的全量參數更新還支持 LoRA 等只更新部分參數的高效微調方法、支持 Deepspeed 微調、支持 int8、int4 量化和國產芯片訓練推理,推動大模型國產化進程。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 天天综合网天天综合色| 日韩内射美女片在线观看网站 | 国产三级中文字幕| 欧美交换性一区二区三区| 国产青草视频免费观看97| jizzyou中国少妇| 精品国产三级a∨在线| 国产午夜影视大全免费观看 | 日本免费一本天堂在线| 亚欧在线精品免费观看一区| 欧美日韩一区二区三区自拍| 亚洲综合在线视频| 男人猛躁进女人免费观看 | 久久久精品人妻一区二区三区 | 日本天堂影院在线播放| 乱淫片免费影院观看| 欧美内射深插日本少妇| 亚洲欧美在线观看首页| 激情吃奶吻胸免费视频xxxx| 免费看欧美一级特黄a大片一| 美女的尿口视频网站| 国产精品女同一区二区| 中文字幕亚洲欧美日韩不卡| 日本免费a视频| 久久婷五月综合| 日韩精品无码一本二本三本| 人人狠狠综合久久亚洲婷婷| 精品亚洲国产成人| 国产强伦姧在线观看| 天天综合天天色| 国产精品一久久香蕉国产线看观看| 2015日韩永久免费视频播放| 国产色婷婷精品综合在线| 97精品人妻一区二区三区香蕉| 天堂一码二码专区| 久久精品国产亚洲精品2020| 欧美bbbbbxxxxx| 亚洲乱妇老熟女爽到高潮的片| 男女边吃奶边做边爱视频| 国产三级电影免费观看| 高潮抽搐潮喷毛片在线播放|