2024-05-14 10:28:16
科技日報訊 (記者馬愛平)記者5月12日從中國農(nóng)業(yè)大學獲悉,該校生物學院王喜慶教授團隊聯(lián)合上海人工智能實驗室、崖州灣種子實驗室日前發(fā)布了我國首個種業(yè)大語言模型“豐登”。
“‘豐登’集成了人工智能模型‘書生·浦語2.0’與大數(shù)據(jù)分析技術。通過深入學習我國迄今發(fā)布的科研文獻、科技書籍、種企報告和歷史推廣數(shù)據(jù),‘豐登’可準確解答有關作物品種在選育推廣、農(nóng)藝性狀、栽培技術、推廣區(qū)域等方面的問題?!蓖跸矐c告訴記者。
相較于國內(nèi)外其他大語言模型,“豐登”重點關注生物育種領域。
據(jù)王喜慶介紹,該模型具有四大核心能力。首先,可系統(tǒng)深度挖掘并結(jié)構(gòu)化我國育種領域積累的學術文獻、書籍、田間日志等知識。其次,可利用多學科知識圖譜,整合生物學、遺傳學、氣象學、土壤學等相關領域知識,并發(fā)掘這些領域知識之間的聯(lián)系。再次,能通過自然語言對話接口降低技術門檻,用戶可直接提出問題并迅速獲得答案,確保信息的實時性和高效獲取,提高工作效率。最后,它不僅服務于育種專家和科研人員,也能為全國農(nóng)業(yè)工作者提供支持,加速育種知識的傳播和應用。
經(jīng)評估測試,“豐登”在最佳答案個數(shù)和綜合分數(shù)上的表現(xiàn)均超出預期,在多個評估維度上超越了國際領先水平的大語言模型。
目前,“豐登”的首個重要版本——“豐登1.0”擁有超200億參數(shù),并已開放針對水稻相關知識的測試接口申請。首批參與測試的單位包括中國科學院、中國農(nóng)業(yè)科學院、上海市農(nóng)業(yè)科學院、廣東省農(nóng)業(yè)科學院、華中農(nóng)業(yè)大學、華南農(nóng)業(yè)大學、復旦大學等。