关闭广告

大多数用户都习惯使用Gemini 作为一种用于文本生成、头脑风暴或快速信息检索的高级大型语言模型mac然而,用户体验方面的真正突破是Gemini 直播。这项功能突破了传统的界限。 chat这是迈向全面多模态辅助的一步,它不仅等待你的按键操作,还能通过你的摄像头、麦克风和屏幕感知世界。

这不仅仅是一个简单的 语音输入是打字的另一种选择。 Gemini 已上线 将与人工智能的交互转变为自然流畅的对话,并直接集成到操作系统和您的日常生活中。

如何激活Gemini 生活?

如果您使用安卓生态系统,这些功能 Gemini 已上线 直接集成到原生应用程序中i. 访问此界面非常直观,但乍一看可能容易被忽略。只需点击应用右下角带有火花图标的波浪线,即可激活该模式。 已上线.

专业版 max为了最大限度地提高效率并实现免提控制,还可以使用语音命令: “嘿,谷歌,我们聊聊吧。” 系统会立即将您切换到交互模式。首次启动后,经过简单的初始设置,您将看到远超语音输出的功能选项——尤其是摄像头集成和实时屏幕共享。

当相机取代了复杂的描述

使用人工智能的最大障碍之一是尝试用文本准确定义视觉或技术问题。借助 Ge,我们可以解决这个问题。mini 活下去,这个障碍消失了。功能 计算机视觉 (计算机视觉)使人工智能能够“看到”你所看到的东西。

一个典型的应用示例是分析产品标签上令人困惑的说明,或者解决其他设备的技术问题。无需费力地重写文本或查找正确的术语,只需指向目标对象即可。 对准镜头。葛mini Live实时分析视觉数据,提取关键信息macea 将为您提供清晰的解释或解决方案,从而避免了反复试错提问的方式。

上下文辅助和屏幕共享

Gemini Live 表现出色 在不同的应用程序之间保持上下文借助屏幕共享功能,您可以邀请 AI 直接在您的环境中解决问题。长按电源按钮即可启动 Gemini 作为另一层 显示在当前应用程序上方.

这在遇到令人困惑的讨论(例如在 Reddit 上)或缺乏上下文的复杂数字内容时非常理想。启用此选项后,即可实现此功能。 “与 Live 共享屏幕” 您可以允许助手分析显示的数据,然后提出其他问题。整个过程无需切换窗口。

优化工作而不中断节奏

传统的查询写作方式常常会打断一种高度专注的状态,在这种状态下,你不想把手头的工作离开。mini Live 将这个过程简化到与同事进行日常对话的程度。

如果在创作过程中,你突然想到一个需要记录或阐述的想法,那就大声说出来。mini 系统会处理它,之后你可以阅读完整的对话内容。 在历史上追溯 chatů因此,在手动搜索过于繁琐低效的情况下,助手可以作为第二意见或快速帮助。

今日阅读最多的

.