OpenAI的Sora迎来劲敌Meta推出媒体基础模型Movie Gen
OpenAI的Sora迎来劲敌,Meta推出号称最先进的媒体基础模型Movie Gen。Meta表示,Movie Gen是公司“针对媒体的突破性生成式AI研究”,它囊括了图像丶视频和音频等模态,用户只需输入文本,就可以制作自定义的视频和声音丶编辑现有视频,以及将个人图像转换为独特的视频。Movie Gen执行这些任务的表现在人类评估中由于业内类似模型。Meta介绍,Movie Gen是“最先进丶沉浸式效果最佳的故事讲述模型套件”,综合了公司第一波生成式AI媒体研究的Make-A-Scene 系列模型,即可创建图像丶音频丶视频和 3D 动画的模型,以及随着扩散模型出现而针对Llama Image 基础模型进行的第二波研究模型,即可实现更高质量图像和视频生成以及图像编辑的模型。 Meta概括,Movie Gen 具有四种功能:视频生成丶个性化视频生成丶精确视频编辑丶音频生成。对于视频生成,Meta介绍,用户只要提供一个文本的提示词,Movie Gen就可以利用针对文本转图像和文本转视频进行了优化的联合模型,创建高清的高质量图像和视频。Movie Gen的视频模型有300亿参数,这个转换模型能以每秒16帧的速度生成最长16秒的视频。Meta称,发现这些模型可以推理物体的运动丶拍摄主体与物体之间的相互作用,以及相机的运动,并且可以学习各种概念了解有哪些合理的运动,因此,它们成为同类中最先进的模型。在介绍该功能时,Meta展示了多个10秒长度的视频短片,包括一只像萌翻网络的弹跳猪“Moo Deng”那样的小河马游来游去。 单从生成视频的最大长度看 Movie ...
OpenAI又在捣鼓神秘“黑科技”–“草莓 ”(Strawberry)
据媒体援引知情人士透露,生成式AI领头羊OpenAI正开发新的AI大模型项目—-“草莓 ”(Strawberry),而这个“草莓”非常神秘,很可能与提升AI大模型的推理能力有关。据媒体报道,5月份OpenAI的一份内部文件显示,OpenAI的内部团队正开发的“草莓”项目,目的是增强OpenAI的模型的推理能力,处理复杂科学和数学问题的能力,让大模型不仅能生成查询答案,还能提前规划,以便自主、可靠地浏览互联网,进行OpenAI 定义的“深度研究”。 按照十几位人工智能研究人员的说法,这是目前大语言模型还没能实现的功能。很明显OpenAI现阶段还不想公布关于“草莓”的详细资料。当被问及“草莓”的细节时,OpenAI的一位发言人只是绕了个弯表示:“我们希望AI大模型能像人类那样看待和理解这个世界。不断研究新的AI能力是业界的普遍做法,毕竟我们都相信AI的推理能力会随着时间的推移而不断提高。” “草莓”的工作原理严格保密 毕竟即便在 OpenAI 内部,“草莓”的工作原理也是严格保密的,目前仍没有“草莓”的发布时间消息。但有媒体透露,“草莓”项目的前身是Q*算法模型,Q*能够解决棘手的科学和数学问题。而数学是生成式AI发展的基础,如果AI模型掌握了数学能力,将拥有更强的推理能力,甚至与人类智能相媲美。而这一点也是目前的大语言模型还无法做到的。 去年底Q*在OpenAI的内部信中首次曝光,而CEO山姆•奥特曼当时被开除也是因为这个Q*项目。一些OpenAI内部人士指出,Q*可能是 OpenAI 在追寻通用人工智能(AGI)路上的一项突破,其发展速度之快让人感到震惊,并担心AI过快发展可能会威胁到人类安全。在这种担忧蔓延之际,奥特曼在没有告知董事会的情况下,选择加速推进GPT系列模型的开发及商业化,这激发了OpenAI董事会的不满并选择把他踢出局。 OpenAI的野心:利用“草莓”提高大模型的推理能力 虽然无法获取“草莓”的详细情况,但从OpenAI近期的种种蛛丝马迹中可以发现,增强生成式AI大模型的推理能力,是它接下来的发展重心。OpenAI的CEO奥特曼曾强调,今后AI发展的关键将围绕推理能力展开。 在7月9日的一次内部全员会议上,OpenAI展示了一个研究项目的演示,称该项目拥有类似人类的推理能力。OpenAI发言人向媒体证实了这次内部会议,但拒绝透露会议细 […]
推出Project GR00T项目英伟达进军人形机器人领域
英伟达( NVIDIA) CEO黄仁勋表示:“为通用人形机器人构建基础模型是当今人工智能领域最令人兴奋的难题之一。” 人形机器人是当下机器人领域最火热的话题之一,一方面吸引了大量风险投资,另一方面也引发了巨大的质疑。英伟达自然不会错过这块蛋糕。作为人工智能领域当之无愧的硬件巨头,英伟达一直通过 Isaac 和 Jetson 等项目推动机器人创新。在年度 GTC 开发者大会上,英伟达宣布通过 Project GR00T(Generalist Robot 00 Technology)项目正式进军人形机器人领域。 英伟达将这一新平台称为“人形机器人通用基础模型”。本质上,该公司正在为近期涌现的人形机器人制造商(包括 1X Technologies丶Agility ...
库迪咖啡Cotti Coffee准备让机器人和人类一起工作
中国连锁咖啡品牌–库迪咖啡(Cotti Coffee)于2024年1月3日宣布在全球范围门店内规模化推行商业机器人应用,希望通过门店员工和机器人的协作,优化客户体验和成本结构。根据库迪发布的详细信息,人机协作门店由配料机器人、制作机器人和送餐机器人三部分组成,可实现有人值守和无人值守两种状态。这一人机协作战略将在库迪咖啡品牌和旗下其他品牌门店同步推行,包括库迪在1月3日正式宣布推出的奶茶品牌“茶猫”。 据悉,茶猫将聚焦“健康奶茶”赛道,所有门店均配备人机协作系统,首店将于2024年1月在北京合生汇开业。从库迪发布的机器人图片看,这类机器人拥有机械摇臂,应用于茶猫奶茶店的制作。眼下,在库迪咖啡的在营业门店,尚不能看到机器人工作的场景,库迪相关人员告诉界面新闻,机器人应用于新开业的门店。但对于机器人设备的费用是否由加盟商承担、机器人出餐效率以及能贡献的人力成本等问题,库迪方面未能给出更多回复。 库迪计划于2025年底全球开设2万门店 截至目前,库迪在全球的门店数量已达到7000家,该公司目标是2025年底全球门店数量达2万家。实际上,引入咖啡机器人的做法在咖啡连锁行业中已有库迪的老前辈瑞幸咖啡(luckin coffee)尝试过了。瑞幸咖啡在2019年曾在北京一家航天主题(致敬NASA)门店中,引入了全自动咖啡机器人设备,门店系统收到订单后,由机械臂完成自动落杯、制作咖啡、取杯操作,全程无需工作人员操作以及协助,且后台进行实时监控,这使得当时的瑞幸门店成为网红打卡地。 2021年,咖啡机器人再次火起。北京大悦春风里引入了手冲咖啡机器人,用来吸引消费者注册该商场会员,这一年,上海街头也一度兴起过机器人咖啡馆“ CYBER COFFEE”,当时的消费者评价时,能拉花,可手冲,出品不到1分钟,单店最高日销500多杯,此外,深圳的精品咖啡店Something For,在其壹方城店开业时也引进了一款“手冲机器人”。 摇臂咖啡机器人曾被视为观赏性质 但这些观赏性较强的摇臂咖啡机器人最终并没能被持续商用,瑞幸此前那家主题门店在大众点评网站的最新点评图片也显示,此前引进的咖啡机器人设备并未投入使用,操作吧台仍然和其他瑞幸咖啡门店一样,由人工制作完成咖啡出品。而上海的CYBER COFFEE如今只在深圳找到一家,这位于深圳坑梓的咖啡店并无赛博痕迹,产品最终仍由店员做出。 现 […]
ChatGPT劲敌来了马斯克旗下xAI推出首个AI大模型Grok
埃隆·马斯克(Elon Musk)旗下xAI团队发布了其首个AI大模型产品Grok。据该团队介绍,Grok是仿照科幻作品《银河系漫游指南》设计的。据xAI上周六的一份声明称,该产品“有智慧,还有叛逆的性格”,并且能回答被大多数其他AI系统拒绝的辛辣问题。 另外,Grok还可以访问社交平台X的数据,xAI表示这将为其提供支持。上周日,马斯克发布了Grok与另一个人工智能机器人回答一个问题的对比图,并称后者掌握的最新信息较少。不过,xAI在其声明中闪烁其词,称就像任何大型语言模型一样,Grok“仍然可能生成虚假或矛盾的信息”。 最终Grok将成为X Premium+的一个功能 该原型目前还处于早期测试阶段,只接受了两个月的培训,在该公司更广泛地推向市场之前,该聊天机器人将供部分用户进行测试。用户可以在等候名单上注册,以获得使用该产品的机会。马斯克在X上表示,最终Grok将成为X Premium+的一个功能,每月收费16美元。 根据马斯克的话,xAI似乎被定位为OpenAI、Inflection和Anthropic等公司的挑战者。在基于中学数学问题和Python编码任务的第一轮测试中,该公司表示,Grok超越了“其计算类中的所有其他模型,包括ChatGPT-3.5和Infection-1。”它的表现优于拥有更大数据库的机器人。 据了解,Grok是Robert a.Heinlein在1961年编著的科幻小说《陌生国度里的陌生人》中创造的一个术语。在这本书中,“Grok”是一个火星术语,没有直接的地球翻译。评论家普遍认为这个术语是对某件事有着深刻的同理心或直觉的说法。韦氏词典则将其简单地定义为及物动词,意思是“深刻而直观地理解”。 欲了解更多, 请参阅 《创投时代》(VCNews)电子报 www.vc-news.com.cn 谷歌(Google)公司的人工智能聊天机器人“巴德”(Bard)表示,美国司法部在针对该搜索巨头的具有里程碑意义的反垄断审判中取得了胜利,并谴责谷歌滥用非法的“垄断力量”,“伤害了消费者”。 当被问及是否同意美国司法部的观点时,巴德站在联邦政府一边,宣称美国检察官的证据清楚地表明,谷歌“非法利用其垄断力量来维持其在在线搜索市场的主导地位”。“我相信司法部应该在本案中获胜,”巴德说。 “如果谷歌被发现违反了反垄断法,法院应该命令谷歌改变其商业行为,让其他 […]
24小时无休无周末波兰酒企聘AI机器人任CEO
人工智能(AI)的技术日新月异,不少人开始担心起自己会被AI取代,但你想过“总裁”一职也会被AI取代吗?波兰一家酒品公司早前率先聘请AI机器总裁,希望能为公司增加业绩。 根据报道,这位酒品公司欧洲区人工智能总裁名称为米卡。他在接受路透社访问时说:“你好我是米卡,全球首个试行的人工智能机器总裁,很高兴能认识你。” 他也说,自己处于24小时满负荷工作的状态,“没有周末”。 这款名为米卡的机器人,在公司的会议上积极参与员工的讨论,并给予意见。“我的决策过程依赖广泛的数据分析,并确保决策符合公司的战略目标,过程中避免了个人偏见,确保做出的决定公正公平,同时以公司的利益为优先考量。” 机器人总裁没有裁员的权限 公司重大决策非她一人决定 酒品公司负责人对米卡担任总裁的表现赞赏有加。他说公司还扩大了米卡的工作范畴,除了让米卡寻找潜在客户,收藏高端的朗姆酒,接下来还需要帮公司挑选酒瓶设计师。 根据报道,公司强调米卡总裁没有裁员的权限,公司的重大决策也非她一人决定。 酒品公司欧洲区总裁马雷克说:“公司的重要决策还是由人类执行团队做出,人工智能机器人首席执行官除了能全力支持人类执行团队,它的独特性也为公司增添优势。” 这款机器人由香港汉森机器人技术公司所研发。体型和身高都和人类相似,除了双脚是以轮子来移动。 欲了解更多, 请参阅 《创投时代》(VCNews)电子报 www.vc-news.com.cn 据媒体报道,科技巨头–谷歌(Google)和美国国防部近年来一直在悄悄地研究一种由人工智能驱动的增强现实显微镜(ARM),目前,这项技术仍处于早期研究阶段,尚未被积极用于帮助诊断患者疾病。 但初步研究结果令人鼓舞,专家们纷纷认为,ARM很有可能会成为病理学家诊断疾病的重要工具。 目前共有13台ARM设备,其中一台属于非营利组织MITRE公司,该公司与政府机构合作解决涉及技术的重大问题。MITRE的研究人员正在找出ARM在临床环境中可能存在的漏洞。 AI直接覆盖在显微镜视野上 使得医生既定工作流程不会中断 ...
生成式人工智能(AI)或将彻底改变在线广告行业
据报道,就在ChatGPT去年因为超强的问答能力而火遍全球后不久,数字营销老兵谢恩·拉斯纳克(Shane Rasnak)就开始尝试这项技术。 拉斯纳克的整个职业生涯几乎都在为客户制作网络广告,正是这样的经历,让他看到了生成式人工智能(AI)会给这个行业带来多大的变化。 他表示,无论是制作脸书(Facebook)广告标题还是创作广告文案简介,以前都至少要花费他30分钟至1个小时,但现在只需要15分钟即可完成。而且,这还只是开始。 Midjourney等AI工具可将文本提示转化成图片 拉斯纳克还在尝试Midjourney等生成式人工智能工具,它可以将文本提示转化成图片,帮助他为脸书广告配上引人入胜的视觉内容。拉斯纳克称,这款软件对于没有图形设计背景的人来说尤其方便,而且可以与Canva和Photosohp等常见的图片编辑工具一起使用。 虽然整个生成式人工智能行业仍处于发展初期,但拉斯纳克认为,从这项技术对数字广告行业的影响来看,它“就像是社交媒体的出现”。 脸书和推特让广告主可以基于人们的喜好、兴趣和朋友来定位消费者,而生成式人工智能则使之可以通过量身定制的消息和图片,来制作和优化广告。 欲了解更多, 请参阅 《创投时代》(VCNews)电子报 www.vc-news.com.cn 自ChatGPT等生成式人工智能(AI)爆火以来,许多机构和权威人士纷纷对此提出了警告,而失业就是其中最大的风险之一,因为人工智能会造就大量“无用阶层”,引发社会的不稳定。 但未曾想到的是,人工智能首先改变了科技行业的就业形势。近几个月来,越来越多的科技公司将人工智能作为裁员和重新考虑招聘新员工的理由,因为硅谷各大科技公司正在竞相采用和推广这种技术。 上个月,美国课外辅导在线教育公司–谢格公司(Chegg)在一份监管文件中表示,将在全球范围内裁员约80人,约占员工总数的4%。此次裁员是受到人工智能影响,越来越多的学生正转向ChatGPT等人工智能聊天机器人寻求功课帮助。 IBM暂停招聘可能会被AI取代的职位 此外,谢格公司称此次裁员将能更好地执行人工智能战略,并为其学生和投资者创造长期丶可持续的价值。 IBM CEO阿文德·克里希纳于5月份曾表示,预计公司将暂停招聘“可能在未来几年被人工智能取代的职位”。克里希纳指出,人力资源等后台职能部门的招聘将暂停或放缓,“这些不面向客户的 ...
计划斥资1亿英镑英国政府打造国家人工智能(AI)
继加密货币浪潮之后,英国政府再度追热点,计划斥资一亿英镑打造基础模型,保卫英国“数码主权”,维持“作为科技大国的领先地位”。 在人工智能(AI)大战当中,中国和美国抢戏,老欧洲除了在监管上重拳出击GPT,其他方面暂时还没有什么动作。唯有一个国家的动作格外高调——英国。 英国首相苏纳克、科技大臣多内兰及多家政府机构联合宣布,将斥资1亿英镑,约1.25亿美元,开发其“国家AI”。 希望开发具备全球竞争力 更加安全可靠的人工智能 根据新闻稿内容,英国计划成立一个由政府-业界人士混搭的特别小组,打造英国自有的“基础模型” ,与ChatGPT和Google Bard这样的大型语言模型竞争。 英国希望能够藉这笔投资开发具备“全球竞争力”且更加安全可靠的人工智能。其实,在追热点这件事情上,英国政府,至少是本届苏纳克政府,一向不甘人后。 去年,当时还是财政大臣的苏纳克就曾经宣布,皇家铸币厂将发行官方NFT,作为对加密货币潮流的一种“前瞻性做法”。 但BBC近日报道称,随着NFT的热度渐渐消退,英国财政部已经放弃了这一计划。根据BBC报道,一名政府官员表示,选民不应该把钱浪费在投机性代币上,“除非他们准备失去所有的钱。” 欲了解更多, 请参阅 《创投时代》(VCNews)电子报 www.vc-news.com.cn AI颠覆金融行业的速度,或许比大多数人想的要快得多。 全球最大的会计师事务所–普华永道(Pricewaterhouse Coopers; PwC)发布声明称,该公司计划在未来三年投资10亿美元,用于发展生成式AI技术,并将与微软(Microsoft)和OpenAI合作,使其在税收、审计和咨询服务的各个方面实现自动化。 ...
英国加大力度研究是否推出央行支持的数码英镑1
英国央行和财政部加大力度创建一种与实体钞票并行的数码货币,并希望缓解对此举可能威胁到银行业稳定的担忧。 两家机构的官员表示,这种被非正式地称为“Britcoin”的央行数码货币,最早将在本十年的下半段推出,可能会为英国消费者和企业带来重大机遇。 此类举措是全球各地央行努力适应新型支付方式的一部分,在网上交易中,新型支付方式速度更快丶使用更便利。随着消费者转向使用企业支持丶而非政府支持的卡支付,也希望维持政府在供应货币中的角色。 英国财政大臣杰里米·亨特说,虽然现金仍然存在,但英国央行发行和支持的数码英镑可能是一种新的支付方式,值得信赖,使用方便。 数码英镑的价值将直接与英镑钞票挂钩 在咨询文件中,央行和财政部将就是否应该创建正式名称为“数码英镑”的数码货币征求意见。他们尚未就是否推进该项目做出决定,但当前进行的工作为后续行动奠定了基础。 数码英镑的价值将直接与英镑钞票挂钩,不像比特币的价值随需求而变化。消费者不必去银行开设账户,只需在智能手机或电脑上拥有一个电子钱包账户,而且这些钱包可以由多家公司运营。 欲了解更多, 请参阅 《创投时代》(VCNews)电子报 www.vc-news.com.cn 据报道,美国网络新闻媒体公司–Buzzfeed发布了引入AI技术的测试栏目quizzes,旨在用新技术赚取更多利润。 quizzes栏目有一系列测试问题,比如性格测试丶兴趣爱好测试等等。现在quizzes多出一些问题,它引入了AI,比如其中一个与情人节有关,由园艺和草坪养护产品供应商Scotts Miracle Gro Co赞助。还有一个问题让读者用AI撰写浪漫喜剧或者分手信息。 有了AI之后,Buzzfeed希望quizzes能够变得更有互动性,最终带来更多的广告和付费订阅收入。有的quizzes只面向BuzzFeed+订阅者开放,订阅之后可以无广告内容,但每月要交2.99美元。 有了AI公司便可生成无限的结果 Buzzfeed编辑部高级副总裁杰西卡·普罗伯斯(Jessica ...
美国加密交易平台Kraken关闭日本业务
在2022年11月宣布全球裁员后,美国加密货币交易所–Kraken将于下个月关闭其在日本的业务,理由是日本目前的市场状况不佳以及全球加密货币市场疲软。 Kraken宣布,在东京运营Kraken服务的Payward Asia Inc.于2023年1月31日关闭交易业务。 该公司计划要求客户将他们持有的加密代币转移到不同的钱包,或将其兑换成法定货币。 Kraken还表示,其资金充足,可确保所有受影响的客户都能及时提取资产。 这是Kraken第二次关闭在日本的业务 值得注意的是,这是Kraken第二次关闭其在日本的业务。上一次是在2018年4月,以便更好地将资源集中在“其他地区”的增长上。不过,2020年10月,该公司决定重启日本业务。 最近几个月,Kraken一直专注于削减成本。就在2022年11月,Kraken宣布将在全球裁员30%,约1100人,因严峻的市场环境削弱了对数字资产的需求。 此前,Kraken的竞争对手Coinbase Global Inc.和Gemini等也采取了类似举措。 2022年以来,币价跌跌不休丶交易活动大幅减少,而萨姆•班克曼-弗里德(SBF)的数字资产帝国FTX的崩溃进一步加剧了加密货币领域的不确定性,动摇了投资者的信心。 欲了解更多, 请参阅 《创投时代》(VCNews)电子报 www.vc-news.com.cn 两大巨头美国广告营收的合计市场占有率预计2022年将下滑至48.4%,为2014年以来首次低于50%,并为连续第5年下滑,2024年预计将进一步降至43.9%。 2022年以来,不少企业都在削减广告预算以应对升息丶高通胀的冲击,但巨头依然选择锲而不舍地抢食美国价值高达3000亿美元的数字广告蛋糕。 ...