霸榜测评的开源大模型，为何是阿拉伯人搞出来的？|投资界

在当下的大模型赛道上，开源大模型已经成了一股愈发无法忽视的力量。

无论是Meta的LLMA2，还是国内的百川大模型，都在竞相迭代，渴望在这场AI浪潮中取得更多优势。

然而，就在中美AI企业角力之时，“评分最高开源大模型”的桂冠，却突然在一夜之间被阿拉伯人拿下了。

这个惊爆全网的开源大模型名为Falcon 180B，由阿联酋的技术创新研究所（TII）开发。

一经推出，Falcon 180B就在推理、编码、熟练度和知识测试各种任务中，一举击败了Llama 2。

于是，由3.5万亿token训练而成的Falcon 180B，迅速了登顶Hugging Face排行榜。

在HellaSwag、LAMBADA、WebQuestions等测试中，Falcon 180B已经能够与谷歌PaLM 2不差上下，性能直逼GPT-4。

同时，在Hugging Face开源大模型榜单上，Falcon 180B也是当前评分最高（68.74分）的开源大模型，超越了LlaMA 2（67.35）。

看到这儿，问题来了：在很多人的印象中，阿联酋是一片充满沙漠，以石油为主要收入的国家，那么，这么个往日的“石油大国”，怎么就突然在AI领域一飞冲天，惊诧中美，并在开源领域傲视群雄了呢？

这片遍地黄沙的地方，究竟有着怎样的科研优势？

01 软实力的重要性

这个“世界最强开源大模型”并非诞生在私营的科技企业，而是诞生在阿联酋正儿八经的国立科研机构TII，这是个很值得玩味的事。

身为由政府资助的科研机构，TII在论资金、资源、算力等方面，自然是不必发愁。

例如在算力方面，TII拥有阿联酋*的超级计算机——阿布扎比超级计算机（Abu Dhabi Supercomputer），它拥有超过10万个处理器核心，能够实现每秒20亿次浮点运算（PFLOPS），是全球第15强的超级计算机之一。

然而，用举国体制砸资源、砸设备来“大力出奇迹”这种事儿，很多国家都会做，但为什么偏偏阿联酋却异军突起了？

实际上，除了算力、数据这些大模型必须的“标配”外，真正令TII脱颖而出的变量，就是人才、组织结构、政策等一系列“软实力”。

而在这方面，首先值得一提的，就是TII的*——法赫德·阿尔奥拉伊尼（Fahad Al-Olayan）。

身为国立科研机构的*，法赫德既不是科学院的院士，也不是知名大学的教授、专家，而是阿联酋*的私营控股公司——奧拉伊尼集团 (Olayan Group).的创始人和董事会主席。

请私企的企业家来领导国立科研机构，这在世界上是非常罕见的。

那阿联酋为何这么剑走偏锋？实际上，这是由于阿联酋的副总理阿勒马克图姆酋长看中了法赫德“搞科技”的才能。

具体来说，在加入TII之前，法赫德先是在1997年创立了Axiom Telecom，这是阿联酋，也是中东地区*的移动设备分销商之一。与苹果、三星、华为等多个国际品牌都有合作伙伴关系。

而在2014年时，法赫德又创立了阿联酋*的网络安全公司DarkMatter，专为政府、企业和个人提供各种网络安全解决方案。

后来，法赫德加入了阿联酋人工智能委员会（UAE AI Council），在疫情期间，他与阿联酋国防部合作，开发了一种基于人工智能的新型冠状病毒检测方法，能在几秒钟内通过呼吸分析来诊断感染者。

正是由于这一系列亮眼的履历，副总理阿勒马克图姆心动了，产生了想将法赫德聘为TII总管的想法。

然而，这样大胆的举动，光凭政府*个人的意志还不行，得有相应的法律、政策保障。

在阿联酋的科研之路上，许多高层领导都认识到私营部门和公共部门之间的合作的重要性。于是，阿联酋便专门制定了一系列法律和规章，为私营和公共部门之间的合作提供了便利和保障，如《私营部门参与法》、《公私合作法》等。

而正是有了这样政策上的便利，法赫德才最终得以进入TII这个国立科研机构，并将自己过去经营企业所练就的一系列管理经验和技巧，应用在了科研项目的运作中。

02 组织结构

在法赫德担任TII的总管后，很快便用自己的方式，重塑了整个TII的组织结构。

可以说，现在的TII，虽然名义上是一个非盈利的国立科研机构，但实际上却是以一种企业的方式在运行的。

在管理TII时，法赫德采用了扁平化、集约化的组织管理模式，同时赋予项目负责人更大的自主权和决策权，实现资源的优化配置和利用。

具体来说，他将TII的组织结构简化为三个层次：首席执行官、首席研究员和项目负责人。

首席执行官是TII的最高决策者，负责制定TII的战略方向和发展目标，以及与政府、企业、学术机构等外部利益相关者的关系维护。

首席研究员是TII的核心领导团队，负责制定各自研究领域的研究计划和预算，以及监督和评估各个项目的进展和成果。

项目负责人是TII的基层管理者，负责执行各自项目的具体任务和活动，以及汇报和反馈项目的状态和问题。

在这样的管理模式下，下属科学家、研究员和工程师可以直接与首席研究员沟通和协作，无需经过多层的审批和汇报。

同时，TII赋予了基层员工一定的决策权和创新空间，让他们可以在项目过程中，根据实际情况或反馈结果，及时修改或优化项目方案，提高项目的成功率和影响力。

讲真，这样的管理模式，实际上已经比目前的一些科技巨头，如谷歌、Meta要高效、灵活多了。

而相较之下，一些从谷歌离职的研究者表示，现在的Google反而被笼罩在了类似学术或政府机构的企业文化之下，充斥官僚主义。

一些谷歌匿名高管曾表示，谷歌决策缓慢，是因为皮查伊在考虑决策时过于谨慎，拖延了行动，才在后来被OpenAI反超。

一家政府机构越来越像企业，而一个科技企业却越来越像官僚化的政府机构。

这不得不说是一个很讽刺的现象。

而这种反差的背后，则是两者截然不同的基本盘所致。

就目前来说，大模型，尤其是通用大模型，仍然是一种“技术先于应用”的研究。换句话说，很多研究团队，在研究通用大模型时，实际上并不知道大模型之后的具体应用场景。

但对谷歌、Meta这些商业版图庞大的巨头来说，其在推进具体的研究项目时，往往不能不优先考虑产品化和收益的问题。

而在商业化问题上的谨慎，则导致了其在决策层面的迟缓。

但TII则不同，由于其负责的主体是阿联酋的政府和王室，而非企业股东，因此在一些较为前沿，但产出却不明确的项目上，反而可以放开了手脚去干。

而阿联酋政府和王室，之所以如此不怕“烧钱”，除了自身确实土豪外，另一部分原因，则是出于对“后石油”时代的未雨绸缪。

毕竟，在全球能源结构变化、环境保护的呼声和经济形势变化的大背景下，石油资源的不可持续性，已经愈发明显。

因此，寻求经济多元化发展，就成了维持国家的持续繁荣的必要途径。

在此背景下，AI等新兴的科技产业，就成为了阿联酋等阿拉伯国家所仰赖的一个重要支柱。

03 总结

除了上述提到的因素外，阿联酋在AI方向上，至少还有两大优势性的政策，为大模型的发展铺好了路。

其一就是通过极其优渥的人才政策，吸引了全球各地的AI人才。

在这方面，阿联酋通过颁发长期的黄金签证和远程工作签证，留住了来自全球的AI人才。

这两种签证都是阿联酋政府在2019年推出的新型签证，旨在吸引全球的创新者、专业人士和企业家。

黄金签证是一种为期10年的长期居留签证，可以自动续签，适用于科学家、医生、工程师、艺术家等领域的杰出人才。

远程工作签证是一种为期一年的临时居留签证，可以延长或转换为其他类型的签证，适用于在其他国家有稳定收入的远程工作者。

这两种签证都为AI人才提供了一个灵活和便利的居住和工作环境。

其二，就是在AI伦理方面走得早，比较远。

目前，生成式AI造成的伦理、法律问题，已经成了技术因素之外，另一大制约产业发展的因素。

很多时候，明明技术到位了，但却因为法律、合规方面的原因，导致很多应用和项目迟迟难以落地。

例如AI作图的版权问题，就是一个明显的例子。

而在阿联酋政府在2018年成立了AI伦理委员会，这是全球*国家级的AI伦理机构，旨在监督和指导AI在阿联酋的发展和应用，保护个人和社会的权益和福祉。

阿联酋政府还在2019年发布了《阿联酋人工智能伦理原则》，这是全球*国家级的AI伦理文件，旨在为AI的设计、开发和使用提供一个统一和明确的道德框架，涉及公平、透明、责任、隐私、安全等方面。

可以说，在当下的AI革命面前，阿联酋做出了一系列大胆的尝试。

而这样的尝试，都是为了破除各种横亘在AI发展之路上的壁垒。

这些壁垒有政府与私营企业之间的，有不同文化、国家之间的，也有伦理与法律方面的。

在这个科技变革的关口，人类的一系列制度、法律和文化等上层建筑，已经开始对新兴的AI技术表现出了不适和滞后。

而关于如何破除这种“不适”、“错位”，让人类通向AGI的道路更加平坦，阿联酋做出了一个较好的表率。

打开投资界APP 阅读全文

【本文由投资界合作伙伴阿尔法工场授权发布，本平台仅提供信息存储服务。】如有任何疑问题，请联系（editor@zero2ipo.com.cn）投资界处理。

资讯

7×24快讯

数据

会议

霸榜测评的开源大模型，为何是阿拉伯人搞出来的？

阿尔法工场研究院

03 总结

相关资讯

霸榜测评的开源大模型，为何是阿拉伯人搞出来的？

科研背景创始人的10条生存法则

抢购芯片，揭秘沙特、阿联酋的人工智能野心

AI数据总览

最新资讯

月之暗面K3，撕裂全球AI溢价叙事

从直播到热搜，一届世界杯的「完整旅程」

2026世界人工智能大会 | 启鸣达人首发《世界模型驱动的教育AGI白皮书》

热门TOP5热门机构 | VC情报局