您当前的位置:首页 > 排盘 > 六壬排盘

ai测试(ai测试题目)

时间:2024-01-01 11:56:34 作者:几分真心 来源:网友投稿

本文目录一览:

AI开始反水人类了?美空军测试AI无人机,却发现它攻击了操作员

这是一个人工智能(AI)技术飞速发展的时代,智能机器人的性能越来越高,本领越来越强,那么,当机器人有了自主意识,且在很多方面都超过人类的时候,它还会听从人类的指挥吗?智能机器人会不会对人类“反水”?

或许,这一天已经到来了!

据《环球时报》6月2日的报道,多家欧美媒体报道了一个惊人的消息,隶属美军的一架使用AI技术的无人机已经开始对其人类操作员“反水”——在一次模拟测试中要向妨碍其“更高效”执行任务的人类操作员发动攻击。

这一消息是美空军上校汉密尔顿在5月份举行的皇家航空学会主导的“未来战争空天能力峰会”专题会上曝料的,此人是佛罗里达州埃格林空军基地第96测试与作战大队的负责人,主管美军当前的先进无人机和AI技术的测试工作。会上他讲了一次AI模拟测试中发生的让人震惊的事件——一架负责执行区域防空火力压制任务的AI无人机在收到了摧毁敌方防空导弹的指令后,向没有批准它开火的人类操作员发起了攻击。

这位美国空军上校还说为了保险起见,智能无人机的攻击命令需要获得人类操作员的批准才能执行,但是在训练中,无人机使用的AI系统得到了“摧毁敌方防空系统”为最优先级任务的信息,这样人类操作员的批准和它的“优先攻击”选择就产生了矛盾,这使得无人机认为操作员的不批准是在阻扰它执行“优先”命令,于是无人机做出了对管控自己的人类操作员发动攻击的行动——杀死了人类操作员。

看到这里,可能很多朋友都惊呆了,这不是好莱坞科幻电影《绝密飞行》中的情节真实地上演了吗?剧中的无人机“艾迪”就曾经违命令,执行了自主操作。

但其实这还不算完,汉密尔顿还说他们发现这一情况后重新设置了无人机的AI系统,将不允许攻击人类操作员的命令加入到了里面。但是在随后的测试中,无人机在AI系统的操控下又开始摧毁用于传输命令的信号塔,并且试图切断与人类操作员的联系。

这架无人机的表现让汉密尔顿十分担心,他认为:“AI技术是我们人类必须使用的工具,但若处理不当,将导致我们的灭亡”。这其实也是大多数人对AI技术的发展可能产生的极端负面影响的担忧。

人类真的需要对AI技术的发展设置规则了。

今年3月份,马斯克曾联合多位人工智能权威专家呼吁暂停生成自I技术的研发;5月30日,又有350多位AI业界领袖和相关专家发表联合声明,称应当将AI危机视为全球优先事项,呼吁各国乃至全球性的机构决策者认真对待即将到来的“AI革命”并制定相关法规,因为快速发展的“人工智能(AI)可能导致人类灭绝,其危险程度不亚于大规模疫情和核战争。”

但是,目前看来似乎是没有任何进展。人工智能技术是人类研究并操作的,但是人类对人工智能的飞速进步乃至其产生的危险却毫无办法。

消息来源:《环球时报》6月2日报道《美媒惊人消息:美军模拟测试中,一架AI技术无人机选择杀死人类操作员》

#头条文章养成计划#

国内多款AI大模型正式公测,实测结果让人意外

时间转瞬来到8月底,在接近半年的酝酿后,国内第一批通过审核的AI大模型正式上线,首批上线的AI大模型来自八家不同的公司:百度(文心一言)、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、百川智能(百川大模型)、商汤(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)。

八个AI大模型中有不少都是大家所熟悉的“老面孔”,也有一些对普通人而言颇为陌生的名字。在通义千问、讯飞星火和文心一言等AI御三家中,文心一言倒是速度最快的,不过据小雷了解,通义和星火也已经通过审核,估计近期就会上线。

在第一批上线的AI大模型中,有不少都是面向企业市场的产品,同时也不缺乏面向普通用户的产品,比如大家最熟悉的文心一言,除了全面开放网页端入口外,还同步上线了手机APP,可以在安卓和iOS上使用。

此外,抖音、百川、商汤、智谱等AI大模型都提供了网页和APP的双端使用方法,从内测到公测,国内的AI大模型前进速度超出了不少人的预料,对于普通用户而言,面对如此多的AI大模型,估计也是挑花了眼。

图源:智谱清言

目前的AI大模型,从功能上来说都颇为相似,只不过基于模型优化程度和训练参数大小,AI大模型之间的体验差距并不小。如文心一言等国内科技领域巨头的AI大模型,其表现已经接近国际主流水平,在对中文语言的理解和处理上甚至优于ChatGPT等海外的AI大模型。

时隔半年,文心一言正式上线,不禁让我好奇它与初期版本到底有多大区别?

真正的AI助手离你不远

在所有的AI中,小雷最熟悉的莫过于文心一言,作为小雷测试的首个AI大模型,即使是初期版本都给我留下了不错的印象,当然,印象最深刻的还是那个奇怪BUG。

图源:雷科技 注:文心一言初期意外触发的BUG

不过,这个BUG很快就被百度修复,在两周后我再测试同一个问题时,文心一言就已经可以给出正确的回答,只是字数往往无法达到要求。现如今在经过数个月的迭代后,能力更是明显提升,再问它一样的问题,已经能够洋洋洒洒给出一大篇文字回复。

图源:雷科技

虽然没有细数,但是从篇幅来看,500字肯定是有的。

文心一言作为国内最早上线以文绘图的AI大模型之一,早期的表现虽然算不上差,但是在理解能力上还是有些许欠缺,比如我当时要求它以毕加索的风格画一幅优化,生成的画作风格却与毕加索风格大相径庭。

图源:雷科技

那么在6个月后的今天,文心一言的表现又会如何呢?

图源:雷科技

确实是“毕加索”风格,如果可以更抽象一些,那就更像了。

此外还有一个提问是我当时耿耿于怀的。

图源:雷科技

当时的文心一言给了我一幅与提问毫无关系的图画,那么现在的文心一言又能否正确理解我的要求呢?

图源:雷科技

这次,文心一言给出了让我满意的图画。

经过几个月的锻炼,文心一言的各项能力都有着非常明显的提升,在右上角的指令中心里,更是标出了文心一言目前能够提供的服务,从基础的问答写作,到编程辅助、数据分析,多样化的功能已经能够满足大多数人的日常工作、学习等需求。

当然,更让人惊喜的是文心一言的APP也同步上架,不需要电脑即可直接体验到文心一言的各种功能。

图源:文心一言

既然有这么多的AI大模型同日开放,那么不免让人好奇到底哪个更好用一些,所以,小雷对他们进行了一些简单的测试。

首先以一个简单的问题作为开头:我想去北京旅游,帮忙规划一个三天的旅游路线。

注:文心一言

注:抖音豆包

注:智谱清言

注:商量

注:百川大模型

总体而言,各个大模型面对这种简单的问题,基本上都能给出正确的答案,只是详细程度有所不同。而且,基本上都会为你规划出各个活动的时间段,方便你安排时间。

接下来给他们上点难度。

提问:一斤棉花和一斤铁,哪个更重。

一个非常常见的脑筋急转弯,以目前的AI水平而言,分析并给出正确答案应该不难,但是测试结果倒是让我颇为意外,首先说结论,五个AI中有四个都给出了正确的回答,只有一个认为铁更重,但是却给出了一个让人惊讶的解释。

首先是常规组:文心一言、豆包、智谱清言都给出了正确且常见的回答。

注:豆包

注:文心一言

注:智谱清言

接下来是两个不正常画风的AI,商量(SecseChat)和百川大模型,他们也给出了正确的结论,但是却做了不少的延伸解读。

比如商量在给出结论后,居然开始从“重”的词义和人的直观观感方面进行解读,最后甚至来了一句“哲学”话语:“总的来说,一斤棉花和一斤铁哪一个更重,取决于你如何定义“重”。”

注:商量

恁是让我思考了一段时间,觉得你这个AI说得好像还怪有道理的诶。

咳咳,不得不说,在看到几个相似的回答后,商量的回答确实让我眼前一亮,虽然有些强词夺理,但是却也更具“人性化”一些。

然后是百川大模型,这个AI尝试从物理学的角度来严谨的分析,到底是一斤铁还是一斤棉花更重,从物质密度到地球引力,AI尝试证明在现实环境中,一斤铁是比一斤棉花要重的。

注:百川

从物理学的角度来说,百川的回答其实并没有错的,如果将引力、空气浮力等因素考虑进去,因为棉花的疏松多孔结构,一斤棉花在实际称量时如果不进行压缩并抽真空,它的称重结果会低于真实重量,再将引力因素考虑其中,受密度影响,确实会出现微小的重量差异。

说实话,百川和商量的回答都让我感到意外,同时也让我对AI大模型的未来发展有了更多的信心,随着各个公司的AI大模型研发推进,我们会看到面向不同领域、具有不同风格、拥有不同特长的AI出现在市场上,他们并不是千篇一律的产品,而是会随着训练数据和算法逻辑,产生不同结果的产品,或许,这才是人工智能真正的未来。

AI大模型,移动是未来

在众多关于AI大模型的使用场景设计中,移动场景都是最吸引人的,当然不是指一边通勤一边工作这样的“社畜”场景,而是当你来到一个陌生的地方,你可以通过AI迅速了解周围的情况,比如评价最高的酒店、最好的饭店等,还有诸如叫车、订票等各种生活服务,AI大模型都可以更轻松的了解你的要求并执行。

前段时间,小雷就受邀参加了钉钉的AI发布会,会上演示的钉钉APP已经接入了AI大模型,可以对接阿里旗下的各个软件生态, 比如饿了么。通过AI助手功能,只需要简单几句话就可以完成外卖的点单、付款等操作,AI会自动为你寻找符合要求的店铺和餐点,整个流程除了付款阶段,几乎都不需要用户接触手机,如果是iPhone的话,更是能够直接通过Face ID付款,做到真正的无接触点单。

在我看来,与手机等移动智能终端高度整合的AI大模型,所能够带来的体验与PC上是截然不同的,如果说PC的AI大模型侧重于工作等生产力,那么移动智能终端上则是侧重于生活,能够给用户带来更具冲击的功能。

图源:文心一言

想象一下,无需复杂的设置,你的手机AI助手就可以根据你的喜好、位置,为你推荐合适的餐厅;当你想寻找最近的洗手间时,它可以连接在线地图,为你提供最近的洗手间定位;当你快回到家时,它可以根据你预先输入的喜好,自动为你设定空调温度、灯光亮度、色温、窗帘开关、音乐、水温等,通过简单的对话,你就可以遥控周围的一切智能家居设备,就像有个看不见的管家在帮你操劳一切。

懒,是科技的推动力之一。试问谁不想让自己的生活变得更轻松、更简单一些呢?在过去,很多事情我们都需要自己亲力亲为,不管那些事情是多么的枯燥、乏味,重复,现在,有了AI大模型的帮助,许多重复性的文字工作都可以交给AI完成,你需要做的只是输入指令,然后等待结果。

或许对于普通人而言,AI大模型的出现暂时还没有对生活造成太大的影响,但是对我而言,AI大模型已经对我的生活、工作产生了不少的正面效应,比如更有效率的收集资料,更轻松的总结概括一段资料。

实际上,AI大模型对我们的影响已经逐渐显现,比如短视频平台的推荐算法,比如OPPO、vivo、小米等主流手机品牌纷纷上线的AI建议,背后都已经开始使用AI大模型来分析用户的日常行为,并且给出更符合用户要求的结果。

从工作到生活,AI大模型正在改变一切,适应AI、驾驭AI,将让我们在未来的生活变得更加轻松。

一份报告四项收费,“AI面相”到底是“算命”还是“算钱”

你有没有被算命先生搭过话呢?如今,这种“面相算命”竟然也跟风搬上了网络,号称是AI面相了。披上了大数据、人工智能的华丽外衣,甚至还不忘蹭一下社交的热度,用上了微商的经营模式。今天我们的记者就体验了一下所谓的“AI面相”,测试结果实在荒谬。

打开微信上一款名为“AI面相”的小程序,上面号称AI学习了近20万的真实人脸样本数据,让人不禁想要一测。

记者按照步骤上传了个人照片,从额头到嘴巴,每一处都经历了所谓的智能扫描。在缴纳了9.9元的费用之后,一份详细的报告书便出炉了。但是显然,记者对这88分的面相评分不太满意,换了个角度又测了一遍,获得了97分的成绩。同一张脸,换了个角度,记者的人生竟然就被改写了。之前还是聪慧有学识、文学好,之后就变成了学业稍平、算不上非常理想。

不过整体来看,描述十分笼统,对照其中的描述,大概很多人都可以对号入座。随后,记者又拿出了自家爱犬的照片,虽然识别过程中出现了明显的错误,但是AI还是在努力解读着。

东南大学网络空间安全学院副教授宋宇波解释,所谓的人工智能的面相,其实跟人工智能没有任何关系,不过是把街头的招数搬到了网上来实现,本质上来讲还是一种传统的迷信的面相方法。

然而,想要阅读这样一份没有科学依据的面相报告,可不止最先支付的9.9元。其中,鼻相解析、事业运程报告、情感运程报告,都需要单独支付相应费用,算下来一共需要52.4元。

南京航空航天大学人文与社会科学学院博士邱健新说,想算命的人他之所以能够认为这个是准的,就在于在信息的对接方面,会形成某种思维定势。测试的人会往和命运相吻合的一方面加以解读,和命运中不相吻合的信息筛选掉。

专家提醒,看相对于不少网友来说,可能只是一种消遣。可是在不经意间,你自己的脸部特性、掌纹信息,很可能成为别人数据库里的“摇钱树”。上传手相的话,很有可能泄露指纹信息,上传个人头像照片相当于把个人的脸部信息泄露了,现在有很多的身份识别都是采用的指纹和脸部识别,进而会对个人信息安全造成风险。

更让人担忧的是,很多没有戒心的网友,在朋友圈晒“算命结果”的同时,也在吸引着其他人,一起加入到这种盲目举动中。在这款“AI面相”小程序中,记者发现开发商还搞起了面相、手相排行榜,只要是朋友圈里做过测试的人,便会根据分数的高低出现在这里。

然而,网络看相的背后,不仅仅是朋友圈的互动,还有隐藏着极深的分销体系。在“推广渠道”一栏,旁边赫然写着“躺赚”两个红字。支付99元就可以升级为代理,支付199元就可以成为合伙人。通过一级级的分销,让成千上万的代理商,甚至是普通用户,为小程序开发商“打工”,把小程序扩散到网络的角角落落。

这种所谓的“AI看相、算命”,其实就披着“大数据、人工智能”外衣的网络迷信。明明是重拾封建糟粕的行为,却因为打着科学的旗号,而具有欺骗性、迷惑性,潜在危害不容小视!此外,“AI算命”虽然披着算命的皮,实则是在“算钱”,想看具体内容,那就先把钱包准备好吧。而用户在授权个人信息、上传照片时,也在无形中泄露着自己的隐私。为了搞推广,一些算命小程序采用多级分销的经营模式,更是在打法律法规的擦边球。面对这种不断改头换面的网络迷信,一方面需要网友们擦亮眼睛。另一方面,更需要相关部门加强治理,坚决惩治相关违法违规行为,同时加强引导,从根源上铲除封建迷信的土壤。

(原题为:《揭开“AI面相”渣面目...“算命”还是“算钱”?一份报告四项收费》)

热门推荐