6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台4090服务器推理的开源千亿MoE大模型。
昆仑万维基于目前各大主流模型评测榜单评测了Skywork-MoE,在相同的激活参数量20B(推理计算量)下,Skywork-MoE能力在行业前列,接近70B的Dense模型,使得模型的推理成本有近3倍的下降。同时Skywork-MoE的总参数大小比DeepSeekV2的总参数大小要小1/3,用更小的参数规模做到了相近的能力。
有别于传统的固定系数(固定超参)的aux loss,昆仑万维在MoE训练的不同阶段让模型自适应的选择合适的aux loss超参系数,从而让Drop Token Rate保持在合适的区间内,既能做到expert分发的平衡,又能让expert学习具备差异化,从而提升模型整体的性能和泛化水平。在MoE训练的前期,由于参数学习不到位,导致Drop Token Rate太高(token分布差异太大),此时需要较大的aux loss帮助token load balance;在MoE训练的后期,昆仑万维希望Expert之间仍保证一定的区分度,避免 Gating倾向为随机分发Token,因此需要较低的aux loss降低纠偏。
区别于Megatron-LM社区已有的EP(Expert Parallel)和ETP(Expert Tensor Parallel)设计,昆仑万维提出了一种称之为Expert Data Parallel的并行设计方案,这种并行方案可以在Expert数量较小时仍能高效的切分模型,对Expert引入的 all2all通信也可以最大程度的优化和掩盖。相较于EP对GPU数量的限制和ETP在千卡集群上的低效, EDP可以较好的解决大规模分布式训练MoE的并行痛点,同时EDP的设计简单、鲁棒、易扩展欢迎使用天博 app,可以较快的实现和验证。
由于first stage的Embedding计算和last stage的Loss计算,以及Pipeline Buffer的存在,流水并行下均匀切分Layer时的各stage计算负载和显存负载均有较明显的不均衡情况。昆仑万维提出了非均匀的流水并行切分和重计算Layer分配方式,使得总体的计算/显存负载更均衡,约有10%左右的端到端训练吞吐提升。
Skywork-MoE是目前能在8x4090服务器上推理的最大的开源MoE模型。8x4090服务器一共有192GB的GPU显存,在FP8量化下(weight占用146GB),使用昆仑万维首创的非均匀Tensor Parallel并行推理方式,Skywork-MoE可以在合适的batch size 内达到2200 tokens/s的吞吐。
欢迎使用天博 app玩家的每一次攻击都会对星球造成巨大的伤害,当星球无法承受时就会爆炸。
1、还有丰富的不同的类型的角色等你来自由的选择。
2、轻松完成主线任务和支线任务,提升战斗力,成为强大的法师。
3、通过文字的选择一步步慢慢的解开迷题,通往各种不同的结局。
4、不断的收集着更多的战士角色来帮助自己建立强大的战队。
5、合理的搭配各种不同类型的卡牌,自由的对战自己的敌人。
1、是一款模拟经营的游戏,这款游戏是一个非常休闲的游戏,玩家要帮助叔叔把餐厅装饰的焕然一新的感觉,开始一场餐厅的大冒险之旅,这里给你带来一个消除大闯关的冒险,感兴趣的玩家快来下载体验吧~
2、聘请各种不同的学科的老师,来为孩子们上课,增强学校的教资力量。
3、是一款模拟水族馆的趣味经营类手游,游戏的画风非常的治愈,玩法也十分的有意思,你可以跟这些海洋中的动物来一次非常有意思的互动。在这里你只需要放下心的经营你的水族馆就行。如果喜欢这款游戏的玩家不要在犹豫了快来下载吧。
4、是一款休闲益智类的游戏,这款游戏是以卡通的风格,非常的可爱,是卡牌放置类的游戏,玩家可以与不同的怪物进行对战。在不断的战斗中获取相应的资源,升级自己的宠物,开始一场激烈的战斗吧!
5、玩家可以通过不断的尝试各种不同的组合,来选择自己最擅长组合进行战斗。
1、海量的主线任务等你来领取,去赢得胜利得红包奖励。
2、通过种植各种各样的植物来获取更多的金币,解锁更多不同的种子和建筑。
3、玩家需要不断地挑战各种不同的任务和关卡。
4、游戏非常考验你的技术和走位,一不小心可能就会被其他的玩家消灭。
5、魔镜魔镜的使命是继承家族,祭祀需要终生事奉神的魔女。欢迎使用天博 app下载-欢迎使用天博 app免费下载安卓版
1、是一款角色扮演的手游,拯救三界和平的使命就在你身上了。快去抵挡外来敌人的侵犯吧,少侠上场了,你愿意当这位英勇奋勇的战士去上场作战吗?拯救世界的重大任务来了,喜欢玩这类游戏的朋友不要错过哦!
2、是一款古风修仙类的游戏,且是经过蜀山传页游改变的知名游戏,以蜀山的背景展开激烈的战斗,我们也给大家带来的是相关的游戏资源和玩法说明介绍,希望能够给大家带来足够的帮助。
3、游戏为玩家带来十分精美的游戏画面,丰富多样的游戏玩法。
4、是一款有节奏感的音乐手游。本作将场景设置在一个荒芜的星球上,玩家可以根据音乐的节奏的点击屏幕,正确的打击将会获得收益加成,从而可以建立更多的建筑物来吸引更多的人;准备让你的手指跳起舞来!快来一起打节奏!
5、玩家自由的在这里参加不同的冒险挑战。
查看全部
为纪念中国、哈萨克斯坦和吉尔吉斯斯坦联合申报的“丝绸之路:长安—天山廊道的路网”被列入世界文化遗产名录十周年,陕历博秦汉馆推出“从长安出发:丝路申遗成功十周年主题展”。展览以中国、哈萨克斯坦、吉尔吉斯斯坦三国33处遗产点为核心,在阐释遗产价值的基础上,集中展示申遗成功十年间的研究新成果和保护新面貌。展览中展出中国和哈萨克斯坦等地博物馆和考古基地收藏的文物330余件,让观众领略丝绸之路多元文化的异彩纷呈。
“‘天下同一——秦汉文明主题展’是我30多年策展生涯中一次突破性的尝试。”彭文说,“为了区别于陕历博本馆展览,展出的730余件文物中,战国神兽金饰、战国杜虎符等广为人知的‘明星文物’仅占一小部分,绝大部分文物,比如春秋时期的漆猪、西汉灞桥纸、东汉绿釉陶孔雀灯等,是策展团队在陕历博的库房中精心挑选出的珍品。”
西安灞桥区出土的残纸片由大麻纤维制作而成,掺杂有少量苎麻,质地比较粗糙。根据与灞桥纸同时出土的文物判断,它的年代不晚于公元前118年。虽然灞桥纸是用来包裹铜镜的包装纸,并非用于书写,但却为可书写纸张的产生奠定了基础。200多年后,东汉宦官蔡伦总结前人的造纸经验,革新造纸工艺,制造出更细腻的植物纤维纸,极大地推动了文化的传承和发展。
“城与陵”展厅里,坡道曲折,圆台高起,通过巧妙设计展现出秦汉宫城陵阙的布局。拐角处名为“太仓”的艺术装置,将釉陶仓、华仓瓦当、农具等文物与影像素材整合,讲述“粮食稳,天下安”这一千古不变的话题;考古发现的宠物狗墓葬,周围有许多陶俑玩具陪葬,让参观者感受到埋藏于地下的温情;沉浸式展示空间里,西汉壁画“活”了起来,朱雀掠天欢迎使用天博 app,玉兔走地,二十八星宿闪耀;专为儿童设计的低展台上陈列着体形小巧的动物陶俑,吸引孩子们细细观看……
“技与美”展览分为五色中华、锋毫辉映、舞影曲落、炉中余香4个板块。“五色中华”展区,多彩的文物反映了秦汉时期的五色系统,俄尔灯暗,四壁上映出“五色演绎”动画,绚烂夺目。“锋毫辉映”展区陈列着木简、印章、封泥等文物,展现秦汉书法艺术之美。在“舞影曲落”展区,汉代乐舞俑与现代舞者影像相映,展开一场跨越时空的交流。走进“炉中余香”展区,精美的汉代熏炉映入眼帘,幽幽香气沁人心脾,展柜底座下放置着秘制香料,让人体味“重帘不卷留香久”的意韵。
“文物与科技”系列课程将文物中蕴含的古人智慧与博物馆教育理念相结合,从“古学今用”的视角探寻天文、中医、环保、算术等古代科技的传承与发展。“造纸术虚拟仿真课程”利用虚拟仿真技术模拟传统造纸工艺,让参与者身临其境地感受古法造纸,孩子们纷纷表示“虚拟仿真造纸术”特别好玩。现场展示的“流动博物馆数字化课程”以“周秦汉唐”为主题,遴选45件(组)馆藏精品文物,运用5G、VR、虚拟数字人、视频云播等技术,通过讲解导览、交互展示、文物动画、游戏互动和数字观展等形式,打造“流动博物馆+云课堂”全新教育模式。
“千年秦汉·博物古今”博物馆之夜给人们带来难忘的美好体验。陕历博秦汉馆在灯光映照下流光溢彩,数字幻柜里,一件件文物“动”起来,风采迷人。不远处的大秦文明园中轴线上,“大秦水舞”光影秀气势磅礴,秦鼓汉乐激扬雄壮。“太史公”司马迁踏歌而来,瓦当点亮,时空之门缓缓开启,“秦人的步伐”大型雕塑群在夜色中肃立,众多历史人物纷纷现身,秦汉市井的繁华场景重现眼前。
大流行手记|1月4日:苏格兰全面封锁 东京奥运会或取消现场观众
发布日期: 2026-01-07消费者感叹“价太低” 企业发愁“吃不饱” 大家电回收面临“两难”困局
发布日期: 2026-01-07
欢迎使用天博 app
扫一扫安装
豌豆荚发现更多
李从善
俄称多方向击退乌军乌称继续坚守防线欢迎使用天博 app
2026-01-07 10:27:42
李处励
农民工的烦“薪”事,解决了欢迎使用天博 app
2026-01-07 10:27:42
杜尧臣
新质生产力的科学内涵与发展路径
2026-01-07 10:27:42
罗从彦
湖南石门:林长制“治”出乡村绿富美
2026-01-07 10:27:42
唐怡
“五一”小长假点燃消费市场“烟火气”
2026-01-07 10:27:42 推荐