您当前的位置：首页 > 排盘 > 六壬排盘

ai测试(ai测试题目)

时间：2024-01-01 11:56:34 作者：几分真心来源：网友投稿

八字精批2025运势命中贵人八字合婚

本文目录一览：

AI开始反水人类了？美空军测试AI无人机，却发现它攻击了操作员
国内多款AI大模型正式公测，实测结果让人意外
一份报告四项收费，“AI面相”到底是“算命”还是“算钱”

AI开始反水人类了？美空军测试AI无人机，却发现它攻击了操作员

这是一个人工智能（AI）技术飞速发展的时代，智能机器人的性能越来越高，本领越来越强，那么，当机器人有了自主意识，且在很多方面都超过人类的时候，它还会听从人类的指挥吗？智能机器人会不会对人类“反水”？

或许，这一天已经到来了！

据《环球时报》6月2日的报道，多家欧美媒体报道了一个惊人的消息，隶属美军的一架使用AI技术的无人机已经开始对其人类操作员“反水”——在一次模拟测试中要向妨碍其“更高效”执行任务的人类操作员发动攻击。

这一消息是美空军上校汉密尔顿在5月份举行的皇家航空学会主导的“未来战争空天能力峰会”专题会上曝料的，此人是佛罗里达州埃格林空军基地第96测试与作战大队的负责人，主管美军当前的先进无人机和AI技术的测试工作。会上他讲了一次AI模拟测试中发生的让人震惊的事件——一架负责执行区域防空火力压制任务的AI无人机在收到了摧毁敌方防空导弹的指令后，向没有批准它开火的人类操作员发起了攻击。

这位美国空军上校还说为了保险起见，智能无人机的攻击命令需要获得人类操作员的批准才能执行，但是在训练中，无人机使用的AI系统得到了“摧毁敌方防空系统”为最优先级任务的信息，这样人类操作员的批准和它的“优先攻击”选择就产生了矛盾，这使得无人机认为操作员的不批准是在阻扰它执行“优先”命令，于是无人机做出了对管控自己的人类操作员发动攻击的行动——杀死了人类操作员。

看到这里，可能很多朋友都惊呆了，这不是好莱坞科幻电影《绝密飞行》中的情节真实地上演了吗？剧中的无人机“艾迪”就曾经违命令，执行了自主操作。

但其实这还不算完，汉密尔顿还说他们发现这一情况后重新设置了无人机的AI系统，将不允许攻击人类操作员的命令加入到了里面。但是在随后的测试中，无人机在AI系统的操控下又开始摧毁用于传输命令的信号塔，并且试图切断与人类操作员的联系。

这架无人机的表现让汉密尔顿十分担心，他认为：“AI技术是我们人类必须使用的工具，但若处理不当，将导致我们的灭亡”。这其实也是大多数人对AI技术的发展可能产生的极端负面影响的担忧。

人类真的需要对AI技术的发展设置规则了。

今年3月份，马斯克曾联合多位人工智能权威专家呼吁暂停生成自I技术的研发；5月30日，又有350多位AI业界领袖和相关专家发表联合声明，称应当将AI危机视为全球优先事项，呼吁各国乃至全球性的机构决策者认真对待即将到来的“AI革命”并制定相关法规，因为快速发展的“人工智能（AI）可能导致人类灭绝，其危险程度不亚于大规模疫情和核战争。”

但是，目前看来似乎是没有任何进展。人工智能技术是人类研究并操作的，但是人类对人工智能的飞速进步乃至其产生的危险却毫无办法。

消息来源：《环球时报》6月2日报道《美媒惊人消息：美军模拟测试中，一架AI技术无人机选择杀死人类操作员》

#头条文章养成计划#

国内多款AI大模型正式公测，实测结果让人意外

时间转瞬来到8月底，在接近半年的酝酿后，国内第一批通过审核的AI大模型正式上线，首批上线的AI大模型来自八家不同的公司：百度（文心一言）、抖音（云雀大模型）、智谱 AI（GLM 大模型）、中科院（紫东太初大模型）、百川智能（百川大模型）、商汤（日日新大模型）、MiniMax（ABAB 大模型）、上海人工智能实验室（书生通用大模型）。

八个AI大模型中有不少都是大家所熟悉的“老面孔”，也有一些对普通人而言颇为陌生的名字。在通义千问、讯飞星火和文心一言等AI御三家中，文心一言倒是速度最快的，不过据小雷了解，通义和星火也已经通过审核，估计近期就会上线。

在第一批上线的AI大模型中，有不少都是面向企业市场的产品，同时也不缺乏面向普通用户的产品，比如大家最熟悉的文心一言，除了全面开放网页端入口外，还同步上线了手机APP，可以在安卓和iOS上使用。

此外，抖音、百川、商汤、智谱等AI大模型都提供了网页和APP的双端使用方法，从内测到公测，国内的AI大模型前进速度超出了不少人的预料，对于普通用户而言，面对如此多的AI大模型，估计也是挑花了眼。

图源：智谱清言

目前的AI大模型，从功能上来说都颇为相似，只不过基于模型优化程度和训练参数大小，AI大模型之间的体验差距并不小。如文心一言等国内科技领域巨头的AI大模型，其表现已经接近国际主流水平，在对中文语言的理解和处理上甚至优于ChatGPT等海外的AI大模型。

时隔半年，文心一言正式上线，不禁让我好奇它与初期版本到底有多大区别？

真正的AI助手离你不远

在所有的AI中，小雷最熟悉的莫过于文心一言，作为小雷测试的首个AI大模型，即使是初期版本都给我留下了不错的印象，当然，印象最深刻的还是那个奇怪BUG。

图源：雷科技注：文心一言初期意外触发的BUG

不过，这个BUG很快就被百度修复，在两周后我再测试同一个问题时，文心一言就已经可以给出正确的回答，只是字数往往无法达到要求。现如今在经过数个月的迭代后，能力更是明显提升，再问它一样的问题，已经能够洋洋洒洒给出一大篇文字回复。

图源：雷科技

虽然没有细数，但是从篇幅来看，500字肯定是有的。

文心一言作为国内最早上线以文绘图的AI大模型之一，早期的表现虽然算不上差，但是在理解能力上还是有些许欠缺，比如我当时要求它以毕加索的风格画一幅优化，生成的画作风格却与毕加索风格大相径庭。

图源：雷科技

那么在6个月后的今天，文心一言的表现又会如何呢？

图源：雷科技

确实是“毕加索”风格，如果可以更抽象一些，那就更像了。

此外还有一个提问是我当时耿耿于怀的。

图源：雷科技

当时的文心一言给了我一幅与提问毫无关系的图画，那么现在的文心一言又能否正确理解我的要求呢？

图源：雷科技

这次，文心一言给出了让我满意的图画。

经过几个月的锻炼，文心一言的各项能力都有着非常明显的提升，在右上角的指令中心里，更是标出了文心一言目前能够提供的服务，从基础的问答写作，到编程辅助、数据分析，多样化的功能已经能够满足大多数人的日常工作、学习等需求。

当然，更让人惊喜的是文心一言的APP也同步上架，不需要电脑即可直接体验到文心一言的各种功能。

图源：文心一言

既然有这么多的AI大模型同日开放，那么不免让人好奇到底哪个更好用一些，所以，小雷对他们进行了一些简单的测试。

首先以一个简单的问题作为开头：我想去北京旅游，帮忙规划一个三天的旅游路线。

注：文心一言

注：抖音豆包

注：智谱清言

注：商量

注：百川大模型

总体而言，各个大模型面对这种简单的问题，基本上都能给出正确的答案，只是详细程度有所不同。而且，基本上都会为你规划出各个活动的时间段，方便你安排时间。

接下来给他们上点难度。

提问：一斤棉花和一斤铁，哪个更重。

一个非常常见的脑筋急转弯，以目前的AI水平而言，分析并给出正确答案应该不难，但是测试结果倒是让我颇为意外，首先说结论，五个AI中有四个都给出了正确的回答，只有一个认为铁更重，但是却给出了一个让人惊讶的解释。

首先是常规组：文心一言、豆包、智谱清言都给出了正确且常见的回答。

注：豆包

注：文心一言

注：智谱清言

接下来是两个不正常画风的AI，商量（SecseChat）和百川大模型，他们也给出了正确的结论，但是却做了不少的延伸解读。

比如商量在给出结论后，居然开始从“重”的词义和人的直观观感方面进行解读，最后甚至来了一句“哲学”话语：“总的来说，一斤棉花和一斤铁哪一个更重，取决于你如何定义“重”。”

注：商量

恁是让我思考了一段时间，觉得你这个AI说得好像还怪有道理的诶。

咳咳，不得不说，在看到几个相似的回答后，商量的回答确实让我眼前一亮，虽然有些强词夺理，但是却也更具“人性化”一些。

然后是百川大模型，这个AI尝试从物理学的角度来严谨的分析，到底是一斤铁还是一斤棉花更重，从物质密度到地球引力，AI尝试证明在现实环境中，一斤铁是比一斤棉花要重的。

注：百川

从物理学的角度来说，百川的回答其实并没有错的，如果将引力、空气浮力等因素考虑进去，因为棉花的疏松多孔结构，一斤棉花在实际称量时如果不进行压缩并抽真空，它的称重结果会低于真实重量，再将引力因素考虑其中，受密度影响，确实会出现微小的重量差异。

说实话，百川和商量的回答都让我感到意外，同时也让我对AI大模型的未来发展有了更多的信心，随着各个公司的AI大模型研发推进，我们会看到面向不同领域、具有不同风格、拥有不同特长的AI出现在市场上，他们并不是千篇一律的产品，而是会随着训练数据和算法逻辑，产生不同结果的产品，或许，这才是人工智能真正的未来。

AI大模型，移动是未来

在众多关于AI大模型的使用场景设计中，移动场景都是最吸引人的，当然不是指一边通勤一边工作这样的“社畜”场景，而是当你来到一个陌生的地方，你可以通过AI迅速了解周围的情况，比如评价最高的酒店、最好的饭店等，还有诸如叫车、订票等各种生活服务，AI大模型都可以更轻松的了解你的要求并执行。

前段时间，小雷就受邀参加了钉钉的AI发布会，会上演示的钉钉APP已经接入了AI大模型，可以对接阿里旗下的各个软件生态，比如饿了么。通过AI助手功能，只需要简单几句话就可以完成外卖的点单、付款等操作，AI会自动为你寻找符合要求的店铺和餐点，整个流程除了付款阶段，几乎都不需要用户接触手机，如果是iPhone的话，更是能够直接通过Face ID付款，做到真正的无接触点单。

在我看来，与手机等移动智能终端高度整合的AI大模型，所能够带来的体验与PC上是截然不同的，如果说PC的AI大模型侧重于工作等生产力，那么移动智能终端上则是侧重于生活，能够给用户带来更具冲击的功能。

图源：文心一言

想象一下，无需复杂的设置，你的手机AI助手就可以根据你的喜好、位置，为你推荐合适的餐厅；当你想寻找最近的洗手间时，它可以连接在线地图，为你提供最近的洗手间定位；当你快回到家时，它可以根据你预先输入的喜好，自动为你设定空调温度、灯光亮度、色温、窗帘开关、音乐、水温等，通过简单的对话，你就可以遥控周围的一切智能家居设备，就像有个看不见的管家在帮你操劳一切。

懒，是科技的推动力之一。试问谁不想让自己的生活变得更轻松、更简单一些呢？在过去，很多事情我们都需要自己亲力亲为，不管那些事情是多么的枯燥、乏味，重复，现在，有了AI大模型的帮助，许多重复性的文字工作都可以交给AI完成，你需要做的只是输入指令，然后等待结果。

或许对于普通人而言，AI大模型的出现暂时还没有对生活造成太大的影响，但是对我而言，AI大模型已经对我的生活、工作产生了不少的正面效应，比如更有效率的收集资料，更轻松的总结概括一段资料。

实际上，AI大模型对我们的影响已经逐渐显现，比如短视频平台的推荐算法，比如OPPO、vivo、小米等主流手机品牌纷纷上线的AI建议，背后都已经开始使用AI大模型来分析用户的日常行为，并且给出更符合用户要求的结果。

从工作到生活，AI大模型正在改变一切，适应AI、驾驭AI，将让我们在未来的生活变得更加轻松。

一份报告四项收费，“AI面相”到底是“算命”还是“算钱”

你有没有被算命先生搭过话呢？如今，这种“面相算命”竟然也跟风搬上了网络，号称是AI面相了。披上了大数据、人工智能的华丽外衣，甚至还不忘蹭一下社交的热度，用上了微商的经营模式。今天我们的记者就体验了一下所谓的“AI面相”，测试结果实在荒谬。

打开微信上一款名为“AI面相”的小程序，上面号称AI学习了近20万的真实人脸样本数据，让人不禁想要一测。

记者按照步骤上传了个人照片，从额头到嘴巴，每一处都经历了所谓的智能扫描。在缴纳了9.9元的费用之后，一份详细的报告书便出炉了。但是显然，记者对这88分的面相评分不太满意，换了个角度又测了一遍，获得了97分的成绩。同一张脸，换了个角度，记者的人生竟然就被改写了。之前还是聪慧有学识、文学好，之后就变成了学业稍平、算不上非常理想。

不过整体来看，描述十分笼统，对照其中的描述，大概很多人都可以对号入座。随后，记者又拿出了自家爱犬的照片，虽然识别过程中出现了明显的错误，但是AI还是在努力解读着。

东南大学网络空间安全学院副教授宋宇波解释，所谓的人工智能的面相，其实跟人工智能没有任何关系，不过是把街头的招数搬到了网上来实现，本质上来讲还是一种传统的迷信的面相方法。

然而，想要阅读这样一份没有科学依据的面相报告，可不止最先支付的9.9元。其中，鼻相解析、事业运程报告、情感运程报告，都需要单独支付相应费用，算下来一共需要52.4元。

南京航空航天大学人文与社会科学学院博士邱健新说，想算命的人他之所以能够认为这个是准的，就在于在信息的对接方面，会形成某种思维定势。测试的人会往和命运相吻合的一方面加以解读，和命运中不相吻合的信息筛选掉。

专家提醒，看相对于不少网友来说，可能只是一种消遣。可是在不经意间，你自己的脸部特性、掌纹信息，很可能成为别人数据库里的“摇钱树”。上传手相的话，很有可能泄露指纹信息，上传个人头像照片相当于把个人的脸部信息泄露了，现在有很多的身份识别都是采用的指纹和脸部识别，进而会对个人信息安全造成风险。

更让人担忧的是，很多没有戒心的网友，在朋友圈晒“算命结果”的同时，也在吸引着其他人，一起加入到这种盲目举动中。在这款“AI面相”小程序中，记者发现开发商还搞起了面相、手相排行榜，只要是朋友圈里做过测试的人，便会根据分数的高低出现在这里。

然而，网络看相的背后，不仅仅是朋友圈的互动，还有隐藏着极深的分销体系。在“推广渠道”一栏，旁边赫然写着“躺赚”两个红字。支付99元就可以升级为代理，支付199元就可以成为合伙人。通过一级级的分销，让成千上万的代理商，甚至是普通用户，为小程序开发商“打工”，把小程序扩散到网络的角角落落。

这种所谓的“AI看相、算命”，其实就披着“大数据、人工智能”外衣的网络迷信。明明是重拾封建糟粕的行为，却因为打着科学的旗号，而具有欺骗性、迷惑性，潜在危害不容小视！此外，“AI算命”虽然披着算命的皮，实则是在“算钱”，想看具体内容，那就先把钱包准备好吧。而用户在授权个人信息、上传照片时，也在无形中泄露着自己的隐私。为了搞推广，一些算命小程序采用多级分销的经营模式，更是在打法律法规的擦边球。面对这种不断改头换面的网络迷信，一方面需要网友们擦亮眼睛。另一方面，更需要相关部门加强治理，坚决惩治相关违法违规行为，同时加强引导，从根源上铲除封建迷信的土壤。

（原题为：《揭开“AI面相”渣面目...“算命”还是“算钱”？一份报告四项收费》）