.png)
人工智能导论 课堂笔记
大约 3 分钟
人工智能导论 课堂笔记
第一章 智能体
第一节 智能体和环境
- 任何通过 传感器 感知 环境 ,并通过 执行器 作用于该环境的事物都可以被视作 智能体 。
- 智能体的传感器正在感知的内容称为感知。
- 理性:对于每个可能的感知序列,给定感知序列提供的证据和智能体所拥有的任何先验知识,理性智能体应该选择一个期望最大化其性能度量的动作。
- 任务环境PEAS
- Performance:性能度量
- Environment:环境
- Actuator:执行器
- Sensor:传感器
- 任务环境的属性
- 可观测性:完全可观测 / 部分可观测 / 不可观测?
- 如果智能体在每个时间节点都能访问环境的完整状态,那么这个任务环境为完全可观测的。
- 智能体数量:单 / 多智能体环境
- 确定性 / 非确定性环境
- 如果环境的下一个状态完全取决于环境当前的状态和智能体采取的动作,那么称该环境为确定性的。
- 注意区分“非确定性的”和“随机的”:
- 如果环境的概率是确定的(比如20%),那么称环境为随机的(random)。
- 如果环境的概率是不确定的(比如“有可能”),那么称环境为不确定的(stochastic)。
- 回合式 / 连贯式环境
- 如果智能体的经历可以被划分成原子式的回合,每回合中智能体接受一个感知,执行一个单一动作,且 回合之间相互独立,那么称这个任务环境为回合式环境。
- 在连贯式环境中,只能提的当前决策会影响到未来所有决策。
- 静态 / 动态环境
- 如果环境在智能体思考时发生了变化,那么我们称之为动态环境;反之,称为静态环境。
- 如果环境本身并不随时间变化,但是智能体的性能分数随时间变化,那么我们称之为半动态环境(semidynamic)。
- 离散的 / 连续的环境
- 已知的 / 未知的环境
- 这里的已知 / 未知更多的指的是智能体的设计者对智能体环境规则的了解。
- 可观测性:完全可观测 / 部分可观测 / 不可观测?
第二节 智能体的结构
智能体大致可以分为如下四种:
- 简单反射型智能体
- 此种智能体根据当前的感知选择动作,并忽略感知的历史部分。
- 使用条件-动作规则。
- 简单反射型智能体只能在环境完全可观测的情况下可行。
- 基于模型的反射型智能体
- 此种智能体维护一种内部状态(internal state),该内部状态反映了智能体当前所观测不到的物体的一些信息。
- 维护此种内部状态需要智能体拥有系统的两种信息:
- 环境如何随时间变化 (转移模型)
- 智能体动作对环境的影响
- 除智能体的影响外环境如何发展
- 环境的状态如何反映在智能体的感知中(传感器模型)
- 环境如何随时间变化 (转移模型)
- 依赖于此两种模型的智能体称为基于模型的智能体。
- 基于目的的智能体
- 基于效用的智能体