經濟觀察網 記者 任曉寧
9月6日下午,百川百川智能在北京發布Baichuan 2系列開源大模型,發布這些模型可免費商用,代開01版要聞 - 一季度全國能源供需總體平穩(新數據 新看點)百川智能創始人兼CEO王小川說,模型其開源模型已經全面超越了LLaMA2的川已超性能。
LLaMA2發布于今年7月19日,百川由美國互聯網大廠Meta推出,發布當時在全球引起轟動,代開外界評價說,模型LLaMA2的川已超開源將可能影響大模型最終格局。
Baichuan 2開源大模型主要包括Baichuan2-7B和Baichuan2-13B,百川二者分別為70億參數和130億參數。發布王小川說,代開01版要聞 - 一季度全國能源供需總體平穩(新數據 新看點)其70億參數模型在英文評測級上,模型已經能夠齊平LLaMA2的川已超130億參數模型,能夠做到“以小博大”。
同為大模型創業者的瀾舟科技創始人兼CEO周明也來到百川智能發布會,周明說,國外開源模型更多是支持英文為主的西方語言,對中文的支持要么不足,要么不太友好。他認為,Baichuan2兩款模型,對中文用戶的支持非常友好,而且它的性能在很多方面都超越了英文同等尺寸模型,因此是對中國大模型領域研究和應用的利好消息。
Baichuan 2大模型建立在上一代產品基礎上,王小川解釋說,跟第一代相比,新產品文科、理科能力均得到提升,此外,其代碼能力、安全能力、邏輯、語義理解也有明顯的提升。
百川智能上一代大模型開源后下載量超過500萬次,有200多家企業申請試用百川開源模型,包括云廠商、科技制造公司、消費公司等。在百川智能列出的名單里,阿里云、蔚來汽車、美的集團都是合作伙伴。
百川智能成立于今年4月10日,4個月時間內已發布了3款大模型產品,也是國內首批通過《生成式人工智能服務管理暫行辦法》備案的8家大模型公司之一。此次百川智能又快速推出了2代產品,王小川解釋說,因為百川智能之前有搜索基因,因此天然懂得如何從萬億網頁中間去精選最好的頁面,可以做到去重、反垃圾。在數據處理中,百川智能也借鑒了之前搜索的經驗,能小時級完成千億數據的清洗和去重工作。