巨成結構舉辦DeepSeek專題講座
2月22日,巨成結構特邀華中科技大學電子信息與通信學院高級研究員張小剛為公司全體員工帶來“大模型的發(fā)展與應用”專題講座。本次講座聚焦大模型的發(fā)展現狀、應用關鍵技術、DeepSeek 的應用等熱點議題。巨成結構董事長、經理層、技術專家等全體在漢員工現場參加了講座,駐外員工通過線上直播同步參與。
張小剛老師從大模型技術演進脈絡切入,回顧了大模型從Transformer架構誕生,到GPT、BERT等模型迭代的發(fā)展歷程。他指出,當前大模型的參數規(guī)模已突破千億級,成為全球科技競爭的核心賽道,但目前也存在算力黑洞、幻覺問題、隱私保護等問題。
國產優(yōu)秀大模型DeepSeek通過稀疏MoE架構、FP8高效訓練等底層技術創(chuàng)新,在大幅降低算力成本的同時實現性能對標國際頂尖水平,突破了算力封鎖,掀起了一波DeepSeek浪潮,也為中小企業(yè)應用大模型提供了可能性。
在大模型應用關鍵技術環(huán)節(jié),張小剛老師重點剖析了三項關鍵技術:基于個性化數據的增量訓練、基于私有數據檢索增強生成(RAG)和個性化智能體。
案例演示環(huán)節(jié),張老師展示了多個大模型在具體辦公場景的應用案例,他特別指出,大模型在文本處理、知識檢索等場景已趨成熟,但在復雜計算、前沿專業(yè)領域仍存在明顯局限,大模型更像一個概率整合者,并非知識創(chuàng)造者,因此只能通過檢索到的數據依據概率輸出回答,無法回答精尖領域的專業(yè)問題。
互動環(huán)節(jié)中,大家就知識庫建設、企業(yè)數據隱私保護、部署成本等議題進行交流。針對企業(yè)關注的落地實踐,張小剛老師分享了如何構建企業(yè)數據庫,將內部數據資產與大模型能力深度融合,以此建立企業(yè)“私有化智能大腦”,同時建議采用分級權限、數據脫敏等技術保障信息安全。
巨成結構董事長高作平總結指出, 巨成能夠成為國家級專精特新企業(yè)靠的就是不斷創(chuàng)新,巨成要將AI技術融入各項實際業(yè)務中,在文本、財務、工程方案、檢測報告等業(yè)務場景都可以把大模型用起來,建設巨成公司自己的企業(yè)數據庫,推動巨成邁向高效化、智能化新階段。
- 上一篇: 云南建投參訪巨成
- 下一篇: 庫區(qū)移民有新招