科技圈又炸鍋了!華為開源盤古大模型剛收獲一波掌聲,就被卷入抄襲風波,被質疑基于其他廠商模型增量訓練,這究竟咋回事?

原來是有研究稱,盤古Pro MoE模型和阿里云通義千問Qwen-2.5 14B模型的注意力參數(shù)分布高度相似,開源代碼文件還標注著其他團隊版權聲明,這難免讓人浮想聯(lián)翩,難道華為真“抄作業(yè)”了?
面對質疑,華為盤古團隊迅速回應。聲明表示,盤古Pro MoE是基于昇騰硬件平臺獨立開發(fā)、訓練的基礎大模型,架構設計和技術特性都有創(chuàng)新,還提出分組混合專家模型(MoGE)架構,解決了大規(guī)模分布式訓練的負載均衡難題。
至于代碼中出現(xiàn)其他版權聲明,團隊解釋是部分基礎組件參考了業(yè)界開源實踐,嚴格按照開源許可證要求,清晰標注了版權聲明,這是開源社區(qū)常規(guī)操作,也是對知識產(chǎn)權的尊重。
抄襲質疑在開源大模型領域不是頭一回。此前,零一萬物開源大模型、斯坦福大學的Llama3-V項目都陷入類似爭議。AI大模型開源定義、協(xié)議規(guī)則還不夠清晰,也沒有明確的法律界定,導致亂象叢生。
此次華為盤古團隊回應,不僅是對質疑的有力反駁,也給行業(yè)提了個醒:在開源大模型賽道,創(chuàng)新是根本,合規(guī)是底線。只有堅守這兩點,才能在激烈競爭和復雜輿論中站穩(wěn)腳跟,推動行業(yè)健康發(fā)展 。