国产精品视频在线免费观看_免费久久久一本精品久久区_国产精品麻豆免费版_久久天堂国产精品_欧美日韩亚洲在线_日韩hmxxxx_国产有色视频色综合_国严精品久久久久久亚洲影视_色播亚洲婷婷_亚洲毛片aa

更多精彩 >

昆侖萬維「天工大模型4.0」o1版(Skyworko1)正式啟動邀請測試

2024-11-27 15:39:12   來源:中國網(wǎng)  作者: 

摘要:今天,昆侖萬維正式推出具有復雜思考推理能力的系列模型——“天工大模型4.0”o1版(Skyworko1)。

今天,昆侖萬維正式推出具有復雜思考推理能力的系列模型——“天工大模型4.0” o1版(Skywork o1)。


  Skywork o1是由昆侖萬維集團發(fā)布的具有慢思考推理能力的系列模型。這是國內第一款中文邏輯推理能力的o1模型。不同于現(xiàn)有的復現(xiàn)OpenAI o1模型的工作,Skywork o1不僅在模型輸出上內生了思考、計劃、反思等能力,同時,該開源模型在標準評測集上,對比普通模型推理能力大幅上升,真正讓模型擁有了思考和反思帶來的推理能力的提升。團隊復現(xiàn)o1的技術路線,使得初始推理能力較差的基座模型在基準測試集上成為生態(tài)位SOTA。

  此次發(fā)布的Skywork o1包括三款模型,既有回饋開源社區(qū)的開放版本,也有能力更強的專用版本:

  ?Skywork o1 Open:一款基于Llama 3.1 8B的開源模型,該模型在同生態(tài)位開源模型中評測指標大幅提升達到SOTA水平,并解鎖了許多輕量級模型無法解決的復雜數(shù)學任務。該模型的發(fā)布也將幫助加速國內開源社區(qū)復現(xiàn)o1的進程。

  ?Skywork o1 Lite:該模型具備完整的思考能力,具有更好的中文支持和更快的推理和思考速度。在數(shù)學、中文邏輯和推理類問題上表現(xiàn)突出。

  ?Skywork o1 Preview:這款模型是本次完整版的推理模型,搭配自研的線上推理算法,對比Skywork o1 Lite有著更多樣和“深度”的思考過程,更完善和更高質量的推理。

  其中,我們開源的Skywork o1 Open,在各項數(shù)學和代碼指標上均有大幅提高,將Llama-3.1-8B的性能拉到同生態(tài)位SOTA(超越Qwen-2.5-7B instruct)。同時,8B的Skywork o1 Open也解鎖了很多較大量級模型,如GPT 4o,無法完成的數(shù)學推理任務(如24點計算)。這也為推理模型在輕量級設備上部署提供了可能性。



  同時,我們也將開源兩個推理任務的Process Reward Model(PRM):Skywork o1 Open-PRM-1.5B 和Skywork o1 Open-PRM-7B,相比此前開源的Skywork-Reward-Model僅對整個模型回答進行打分,Skywork o1 Open-PRM能給模型回答中的每個步驟進行打分。

  對比開源社區(qū)現(xiàn)有的PRM,Skywork o1 Open-PRM-1.5B能達到開源社區(qū)8B的模型效果,例如RLHFlow的Llama3.1-8B-PRM-Deepseek-Data,OpenR的Math-psa-7B,Skywork o1 Open-PRM-7B能同時在大部分benchamrk上接近/超過10倍量級的Qwen2.5-Math-RM-72B。Skywork o1 Open-PRM也是第一款適配代碼類任務的開源PRM。下面表格為以Skywork-o1-Open-8B作為基礎模型,使用不同PRM在數(shù)學和代碼評測集上的評估結果。

  除Skywork-o1-Open-PRM外,其他開源PRM均未針對代碼類任務進行專門優(yōu)化,故不進行代碼任務的相關對比。

  詳細技術報告也將在不久后發(fā)布。目前模型和相關介紹在Huggingface開源。

  強推理以及自我反思的能力是如何練成的?

  Skywork o1在邏輯推理任務上性能的大幅提升得益于天工三階段自研的訓練方案:

  ?推理反思能力訓練:通過自研的多智能體體系構造高質量的分步思考,反思和驗證數(shù)據(jù)。通過高質量的、多樣性的長思考數(shù)據(jù)對基座模型進行繼續(xù)預訓練和監(jiān)督微調。

  ?推理能力強化學習:團隊研發(fā)了最新的適配分步推理強化的Skywork o1 Process Reward Model(PRM)。實驗證明Skywork-PRM可有效的捕捉到復雜推理任務中間步驟和思考步驟對最終答案的影響。結合自研分步推理強化算法進一步加強模型推理和思考能力。

  ?推理planning:基于天工自研的Q*線上推理算法配合模型在線思考,并尋找最佳推理路徑。這也是全球首次將Q*算法實現(xiàn)和公開。Q*算法落地也大大提升了模型線上推理能力。

  亮點功能與實測

  Skywork o1模型具有以下能力和亮點功能:

  ?模型思考和規(guī)劃能力

  ?模型自我反思能力

  ?模型自我驗證能力

  相較于此前(長文本任務)大模型,無論是常識推理問題、邏輯推理問題、數(shù)學推理問題、倫理決策問題、還是“弱智”(類似腦筋急轉彎)邏輯陷阱問題等,Skywork o1都處理的游刃有余。整體來說,Skywork o1 Lite和Skywork o1 Preview線上版本在復雜問題分析、思考反思過程、輸出答案質量上均有大幅提升。

  進階版的復雜人類思考能力的解鎖也將進一步在垂類領域增強大模型的應用,例如:

  ?中英文常見邏輯推理和復雜任務,如數(shù)學/代碼類任務,科學研究

  ?高質量內容生成,如創(chuàng)意寫作,行業(yè)報告寫作

  ?深度搜索,解鎖復雜搜索任務的拆解

  2024年以來,昆侖萬維天工AI持續(xù)進化,陸續(xù)發(fā)布了“天工2.0”、“天工3.0”、“天工大模型4.0”4o版——Skywork 4o,以及今天正式發(fā)布的“天工大模型4.0” o1版(Skywork o1),不僅是我們貫徹“All in AGI 與 AIGC” 戰(zhàn)略的重要舉措,更是我們構建AI技術棧的重要一步。我們將秉持“實現(xiàn)通用人工智能,讓每個人更好地塑造和表達自我”的使命,從模型層、應用層等全方位、多維度來構建公司技術競爭力和生態(tài)矩陣。

  測試地址

  “天工大模型4.0” o1版(Skywork o1)開啟測試


猜你喜歡

昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態(tài)思考新時代

昆侖萬維創(chuàng)新創(chuàng)業(yè)

3月18日,昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V,即日起開源模型權重...

2025-03-18

昆侖萬維開源面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1,重塑AI短劇行業(yè)格局

昆侖萬維創(chuàng)新創(chuàng)業(yè)

2月18日,昆侖萬維開源中國首個面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1、中國首個SOT...

2025-02-18

昆侖萬維發(fā)布Matrix-Zero世界模型,開啟空間智能新時代

昆侖萬維創(chuàng)新創(chuàng)業(yè)

2月14日,昆侖萬維正式推出 Matrix-Zero世界模型,成為中國第一家同時推出3D場景生成和可...

2025-02-14

昆侖萬維推出“天工大模型4”4o版(Skywork 4o)

昆侖萬維智能+

從「天工大模型1.0」的研發(fā)到「天工大模型3.0」的發(fā)布,再到今天的「天工大模型4.0」階段,我們堅...

2024-11-20

Midl完成 240 萬美元種子輪融資,蓄勢待發(fā)

Midl

Midl完成 240 萬美元種子輪融資,蓄勢待發(fā)

2025-07-29

南京南智先進光電集成技術研究院完成A 輪融資,邁向新高度

南智光電

南京南智先進光電集成技術研究院完成A 輪融資,邁向新高度

2025-07-29

東莞普諾康生物科技獲天使輪融資,開啟創(chuàng)業(yè)征程

東莞普諾康生物科技

東莞普諾康生物科技獲天使輪融資,開啟創(chuàng)業(yè)征程

2025-07-29

蘇州引航生物科技斬獲超億元 E 輪融資,加速全球布局

蘇州引航生物科技

蘇州引航生物科技斬獲超億元 E 輪融資,加速全球布局

2025-07-29

原創(chuàng)

年入687億,非洲一哥要IPO了

傳音控股

非洲一哥,也來港交所湊熱鬧。

2025-07-29

AI原生游戲與跨境算力布局,游族網(wǎng)絡在WAIC 2025展現(xiàn)新藍圖

上市公司游族網(wǎng)絡

2025世界人工智能大會(WAIC)上,全球800余家科技企業(yè)攜3000余項前沿成果爭奇斗艷,規(guī)模創(chuàng)...

2025-07-29

白酒泰斗季克良領銜,“中國白酒科學文化考察”首站走進宋河

大消費宋河酒業(yè)

7月28日,中國白酒界一場跨越四十年的“科學朝圣”在老子故里鹿邑宋河酒廠啟幕。

2025-07-29

構建“大考古觀”下的中華文明探源新范式——東莞觀音山籌辦首屆中華文化萬年史探源觀音山研討會

文化傳媒東莞觀音山

在人類文明發(fā)展的漫漫長河中,中華文明宛如一顆歷經(jīng)歲月磨礪的璀璨明珠,憑借其獨特的文化基因與深厚的歷史...

2025-07-29

寧德時代的“最大對手”,又要IPO了

畢竟投資者都明白,能買行業(yè)第一,為何要買行業(yè)第五呢??

2025-07-29

貴金屬交易APP綜合測評:實時報價準、安全合規(guī)的五大優(yōu)選平臺

金融科技貴金屬交易APP

在全球經(jīng)濟不確定性加劇的背景下,貴金屬作為避險資產的價值持續(xù)凸顯。

2025-07-29

投資家網(wǎng)(m.hbzbj.cn)是國內領先的資本與產業(yè)創(chuàng)新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務,包括行業(yè)媒體、智庫服務、會議服務及生態(tài)服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。

京杭對話:杭州,憑什么吸引北京創(chuàng)新企業(yè)?

京杭對話:杭州,憑什么吸引北京創(chuàng)新企業(yè)?

從一張精準的產業(yè)藍圖,到一個敏捷的創(chuàng)新操作系統(tǒng),再到一片豐沃的賦能土壤,杭州的生產性服務業(yè)正在這條路...

第19屆中國投資年會·有限合伙人峰會在滬成功舉辦

第19屆中國投資年會·有限合伙人峰會在滬成功舉辦

11月27日,由投中信息和投中網(wǎng)主辦的第19屆中國投資年會·有限合伙人峰會在上海舉辦。

“京杭聚勢,共啟新篇”:招商新路徑,奏響區(qū)域協(xié)同發(fā)展強音

“京杭聚勢,共啟新篇”:招商新路徑,奏響區(qū)域協(xié)同發(fā)展強音

在區(qū)域經(jīng)濟協(xié)同發(fā)展的大背景下,京杭兩地的經(jīng)濟協(xié)作正以一種全新的姿態(tài)加速推進。

第19屆中國投資年會·有限合伙人峰會即將在滬啟幕

第19屆中國投資年會·有限合伙人峰會即將在滬啟幕

作為中國股權投資領域備受矚目的年度盛會,第19屆中國投資年會·有限合伙人峰會定于2025年11月26...

投資家網(wǎng)主辦:“智造未來-人工智能與機器人”專場路演成功舉辦

投資家網(wǎng)主辦:“智造未來-人工智能與機器人”專場路演成功舉辦

投資家網(wǎng)聯(lián)合深圳市龍崗區(qū)人工智能(機器人)署于9月28日聯(lián)合主辦“智造未來——人工智能與機器人”專場...

av噜噜色噜噜久久| 久久99精品久久久久久秒播放器| 久久久久久欧美精品色一二三四| 亚洲午夜精品一区二区| 日韩一二三区不卡在线视频| 色噜噜色狠狠狠狠狠综合色一| 欧美日韩视频在线一区二区观看视频| 亚洲欧美日韩精品久久久| 91成人伦理在线电影| 亚洲一区精彩视频| 成人自拍爱视频| 日韩一本精品| 欧美二级三级| 国产在线一区二区三区欧美| 亚洲国产一区二区在线| 精品一区二区视频| 中文精品一区二区三区| 久久久久久久久久久久久久久久av | 91精品免费| 久久综合精品一区| 亚洲一区二区三区四区中文| 久久综合色一本| 国产亚洲欧美另类一区二区三区| 亚洲精品成人a8198a| 欧美在线激情| 青青影院一区二区三区四区| 久久综合久久综合这里只有精品| 国产青春久久久国产毛片| 91精品久久香蕉国产线看观看| 日韩国产一区久久| 亚洲国产精品www| 中文视频一区视频二区视频三区| 亚洲7777| 精品乱码一区| 日韩欧美一区二区视频在线播放 | 欧美精品一区二区三区在线看午夜| 色综合久久88色综合天天提莫| 免费精品视频一区二区三区| 久久伊人资源站| 欧美一级爽aaaaa大片| 视频一区二区在线| 中文字幕一区综合| 精品国产乱码久久久久久108| 久久精品日韩精品| 97人人模人人爽人人喊38tv| 国产一区二区三区奇米久涩| 欧洲亚洲一区二区三区四区五区| 亚洲一区二区不卡视频| 精品一区二区不卡| 亚洲三级一区| 乱色588欧美| 高清不卡一区二区三区| 欧美日韩系列| 激情视频一区二区| 日日夜夜精品网站| 蜜桃传媒一区二区| 精品久久精品久久| 久久99精品久久久久久青青日本 | 欧美国产一区二区在线| 新呦u视频一区二区| 国模精品一区二区三区| 99精品国产一区二区| 日韩一区二区三区高清| 欧美亚洲另类在线一区二区三区| 国产欧美日韩综合精品二区| 国产无套精品一区二区| 久久国产精品免费一区| 久久久久一区二区| 日韩欧美视频一区二区| 亚洲精品国产一区| 99九九视频| 久久久水蜜桃| 日韩.欧美.亚洲| 一区二区精品在线| 国产伦理久久久| 欧美日韩在线精品一区二区三区| 免费一区二区三区在在线视频| 精品一区二区三区免费毛片| 欧美1o一11sex性hdhd| 日韩中文字幕一区二区| 2019国产精品视频| 日本欧美色综合网站免费| 亚洲午夜激情| 久久久久无码国产精品一区| 欧美综合激情| 国产精品大全| 亚洲.欧美.日本.国产综合在线| 亚洲欧美日韩精品久久久| 国产在线一区二| 99精品国产高清在线观看| 欧美极品一区二区| 精品乱子伦一区二区三区| 在线日韩av永久免费观看| 日本精品二区| 欧美日韩在线播放一区二区| 久久国产精品一区二区三区| av免费观看久久| 成人欧美一区二区三区视频 | 欧美日韩喷水| 国产精品免费区二区三区观看 | 2019国产精品视频| 视频一区三区| 日本中文不卡| 视频一区三区| 7777奇米亚洲综合久久 | 五月天国产一区| 日韩国产在线一区| 宅男一区二区三区| 91丝袜脚交足在线播放| 97免费高清电视剧观看| 超碰97在线人人| 激情欧美一区二区三区中文字幕| 国产成人一区二区三区免费看| 99国内精品久久久久久久软件| 中文字幕乱码一区二区三区| 一本色道久久综合亚洲精品婷婷| 日韩欧美在线一区二区| 一区二区三区国| 国产在线一区二区三区播放| 久久久久久久久一区| 日本福利一区二区三区| 91久久爱成人| 麻豆传媒一区| 999国产视频| 欧美一区二区三区四区在线观看地址 | 日韩欧美三级电影| 91成人伦理在线电影| 久久99精品久久久久久久久久 | av蓝导航精品导航| 久草精品电影| 97久久天天综合色天天综合色hd| 国产福利久久精品| 一区二区视频国产| 欧美主播一区二区三区美女 久久精品人| 日本免费高清一区二区| 国产一区二区高清不卡| 一区二区三区在线观看www| 精品欧美国产一区二区三区不卡| 欧美日韩一区综合| 国产一区二区免费电影| 成人激情av| 国产精品一国产精品最新章节| 亚洲日本欧美在线| 97碰碰视频| 国语精品免费视频| 蜜桃狠狠色伊人亚洲综合网站| 国产精品一区二区在线观看| 2019国产精品视频| 97免费资源站| 久久久久久国产精品免费免费| 国产精品一区二区三区免费观看| 99影视tv| 久久综合精品一区| 视频一区二区三区在线观看| 一卡二卡3卡四卡高清精品视频| 亚洲综合首页| 黄色99视频| 亚洲国产精品123| 国产精品乱码一区二区三区| 免费99视频| 亚洲午夜激情| 精品视频一区二区| 1卡2卡3卡精品视频| 国产在线精品日韩| 亚洲一区bb| 手机在线观看国产精品| 国产嫩草一区二区三区在线观看| 久久视频在线观看中文字幕| 婷婷久久五月天| 国产精品露出视频| 2014亚洲精品| 91精品久久久久久蜜桃| 日韩一区二区三区高清| 久久精品一区二区三区不卡免费视频| 在线亚洲美日韩| 夜夜爽www精品| 亚洲高清123| 亚洲韩国在线| 在线电影看在线一区二区三区| 欧美日韩亚洲免费| 日韩精品久久久| 欧美一区二区影视| 视频一区视频二区视频三区视频四区国产 | 中日韩在线视频| 日韩欧美在线观看强乱免费| 九色综合日本| 欧美精品亚洲精品| 日韩免费电影一区二区| 蜜桃视频在线观看成人| 你懂的视频在线一区二区| 久久av一区二区| 天堂av一区二区| 7777精品久久久大香线蕉小说| 在线看成人av电影| 精品免费国产| 在线电影看在线一区二区三区| 成人欧美一区二区三区视频xxx| 99久久无色码| 色噜噜色狠狠狠狠狠综合色一 | 亚洲欧美日韩精品在线|