视觉智能可能是最强大的特征。这就是它的工作,它的工作原理,我们将介绍几个不同的现实世界示例。
Apple用iOS 18.2添加了视觉智能,您需要一个或iPhone 16 Pro使用它。对不起,用户。
它是在Apple Intelligence功能的保护下提起的。这是iPhone 16家族独有的少数Apple Intelligence功能之一。
此AI功能在您的扫描环境并提供信息。如果这有点抽象的话 - 不用担心,我们将向您展示一堆演示,以展示它如何为您提供帮助。
如何使用视觉智能
为了激活视觉智能,您可以按并将相机控件固定在iPhone的右侧。与打开相机应用程序打开的简短按下相比之下。
当相机打开时,您的手机会振动,并以光滑的彩色动画打开。您将看到一个新的界面,该界面显示了带有“询问”按钮,“搜索”按钮的实时供稿和中间的捕获按钮。
让我们从最基本的用途开始。打开视觉智能,将其指向某物,然后快照。
视觉智能可以帮助识别电线
然后,您可以从Chatgpt获取有关您正在查看的内容的信息,也可以进行Google Image搜索以了解有关它的更多信息。
例如,我们可以拍摄工作室中所有这些不同电缆的照片。每次,视觉智能都能识别它们是哪些,并提供有关它们的一些基本信息。
您甚至可以提出后续问题,以获取有关扫描电缆的更多信息
如果您在电缆上发生的事情不太了解,则可以提出后续问题以获取更多信息。就像DisplayPort电缆可以做什么的详细分解一样。
我们还躺在周围有这种旧的Gameboy颜色。通过视觉智能进行快速扫描,我们可以询问发布的一年。
这些都通过chatgpt为您提供信息。另外,您可以使用图像搜索。
在扫描双重控制器后,我们得到了在哪里购买的结果
当我们扫描PlayStation 5 DualSense控制器时,我们可以看到这种特定的配色。然后,我们可以直接进入沃尔玛应用程序购买它。
使用文本使用视觉智能
在提出问题或搜索照片之外,它还可以帮助文本和数字。
视觉智能可以总结或大声朗读文本
当您将其指向文本块时,出现上下文意识到的新按钮。您可以生成AI摘要或大声阅读手机。
如果您碰巧正在旅行并以另一种语言检测文本,则会出现翻译按钮。当您点击它时,它会拍摄照片并用默认语言替换图像上的文本。
将餐厅菜单翻译成英文
我们通过翻译西班牙餐厅菜单进行了测试。这很棒,因为无需使用任何其他应用程序,并且会自动工作。
最后,文本和数字是求解方程式。当我们还在上学时,这会很棒。
视觉智能可以通过分步结果解决数学问题
您甚至不需要输入它 - 只需使用视觉智能扫描它,然后要求它为您解决。在示例方程式中,它甚至打破了我们的所有不同步骤。
扫描食品
虽然不是完全具体的,但视觉智能也有助于从您的食物中收集宏。像其他演示一样,我们只是将其指向我们的盘子,它确定了食物,并为我们的饮食提供了粗糙的范围。
这只是一个粗略的估计,但是视觉智能为我们提供了有关爆米花的营养信息
我们有少量爆米花,我们问视觉智能是多少卡路里。它告诉我们一些像类型和烹饪方式一样,有一系列卡路里。
如果将该范围与您所知道的爆米花(SmartPop,Air Pop,电影院风格等)相结合,则可以对实际价值有一个不错的想法。
如果更准确
同样,我们拍摄了一张釉面甜甜圈的照片,并询问其中有多少碳水化合物。再一次,它给了我们一系列可能的碳水化合物。
这样的功能对某些用户可能至关重要。就像新诊断的1型糖尿病患者一样,通常是儿童,在碳水化合物计数方面可能还不错。
希望随着AI模型的改善,这会变得更好。
识别动植物
使用iOS 18.3,苹果为视觉智能添加了一些新功能。视觉智能现在可以自动识别动植物。
通过视觉智能识别我们的厨房室内植物
当我们将其指向厨房的一家植物时,一旦识别出植物的名字,就会出现一个泡沫。如果您点击气泡,它将向您显示Wikipedia的其他信息。
当然,如果您在做狗,但您也必须与动物一起工作,但是您必须有些纯种。没有人AI仅仅基于照片就可以准确地推断出狗的血统。
我们的狗不是纯扁平的外套猎犬,但是里面有一些混合
我们的小狗布鲁克林被标记为扁平外套猎犬。尽管她可能有一些猎犬,但无论如何,她都不是纯种扁平外套。
其他更多的通用动物可能更适合这一点。或至少一般识别。
安排约会
iOS 18.3也安排了预约。这与从字幕符号,海报或手写笔记相关的所有内容都可以使用。
在纽约市,我们可以扫描剧院的前部,以在我们的日历中添加开幕日以进行演出。回到家时,我们还可以扫描冰箱发布的日期晚上的注释。
约会之夜!通过视觉智能快速添加到日历中
在保存之前,您确实有机会编辑日历约会。最重要的是,当您在日历应用程序中查看它时,还附加了源照片以供参考。
餐馆和企业
不过,我们最喜欢的视觉智能功能是将其用于建筑物,企业和餐馆。取决于业务,有很多功能。
当我们在纽约市旅行时,视觉情报很方便查找古迹
地标很容易通过视觉智能识别。您可以在构造时看到他们的名字,并且可以看到更多有用的事实。
如果您看到业务,则可以指向手机以获取所有相关的业务信息。它可以显示商店时间,网站,电话号码等。
使用视觉智能获取有关企业的信息
当您扫描餐厅时,可以显示食物的照片,菜单,您可以下订单。假设餐厅支持预订,在线食品订单等。
餐馆可以显示时间,食物照片,菜单,评论,付款方式,甚至可以帮助您安排预订或下订单
我们在一个小镇上进行了测试,发现我们可以在当地的咖啡店里花时间,而披萨店让我们提起菜单并下订单进行随身携带。
视觉智能只会越来越好
从整体上讲,Apple Intelligence的推出缓慢,但Apple显然相信它。添加了越来越多的功能,就像我们在此处看到的视觉智能所看到的一样。
它有点习惯了新按钮等,但是一旦我们开始使用它,它就会变得非常有用。
随着苹果继续迭代Apple Intelligence,我们可能会看到更多的用例出现。