人机交互系统

References

蔡之恒 ——《人机交互——要背的》，室友提炼的重点（？）

人机交互的概念

HCI， Human Computer Interaction
HCI是一门与人类使用的交互式计算系统的设计、评估和实施有关的学科，并且研究了他们周围的主要现象
以用户为中心(UCD, User Centered Design)的设计方法

人机交互发展历史

有四个阶段，但不是后面出现了前面的就消失了，旧的交互形式会作为特例保存下来

批处理卡片

每次只能有一个用户对计算机进行操作
编写程序使用01串表示的机器语言
缺点：
- 不符合人的习惯
- 耗时易出错
- 只有少数专业人士运用自如

联机终端（命令行）

*缺点：*大部分命令语言对用户的输入有严格要求

命令名称的缩写在一定程度上减轻了用户的使用负担

图形用户界面（GUI）

Graphical User Interface

主要特征：直接操纵
GUI优于字符界面吗？
- 不同的交互方式本身在可用性方面没有根本性区别，更重要的是认真对待界面设计的态度 [Whiteside 1985]
优点：依赖识别而非记忆（10条启发式规则之一）

未来的人机交互

多媒体界面
多通道交互技术
虚拟现实、语音交互、脑机交互

EEC

Execution Evaluation Circle 执行-评估活动周期

活动的四个组成部分

目标（Goal） $\ne$ 意图（Intention），单个目标可对应多个意图
执行（Execution）
客观因素（World）
评估（Evaluation）

EEC模型

共7个阶段：1 - 4执行阶段，5 - 7评估阶段
可解释为什么有些界面的使用存在问题

执行隔阂

用户为达目标而制定的动作与系统允许的动作之间的差别

评估隔阂

系统状态的实际表现与用户预期之间的差别

界面类型

这是啥？

人类处理机模型

三个交互式组件

感知处理器：信息将输出到声音存储和视觉存储区域
认知处理器：输入将输出到工作记忆
动作处理器：执行动作

存在的问题

把认知过程描述为一系列处理步骤
仅关注单个人和单个任务的执行过程，忽视了复杂操作执行中人与人之间及任务与任务之间的互动，忽视了环境和其他人的影响

格式塔心理学

相近性原则

空间上比较靠近的物体容易被视为整体

相似性原则

人们习惯将看上去相似的物品看成一个整体

连续性原则

共线或具有相同方向的物体会被组合到一起

完整和闭合性原则

人们倾向于忽视轮廓的间隙而将其视作一个完整的整体

人脑记忆特性

三个阶段

感觉记忆
短时记忆
长时记忆

感觉记忆

又称瞬时记忆
在脑中持续约1s
帮助人们把相继出现的一组图片组合成一个连续的图像序列

短时记忆

感觉记忆经编码后形成
又称工作记忆，约保持30s
储存的是当前正在使用的信息，是信息系统加工的核心，可以理解为计算机的内存
短时记忆的存储能力约为 $7 \pm 2$ 个单元

长时记忆

短时记忆中的信息经进一步加工后会变成长时记忆
只有与长时记忆区的信息具有某种联系的新信息才能进入长时记忆
长时记忆的容量几乎无限，但会遗忘；遗忘指长时记忆中的信息无法提取，但不是信息丢失了

交互设计目标

可用性目标

易学性
易记性
高效率
安全性
效用性
- utility, 指一定程度上该产品提供了正确的功能，可以让用户做他们需要做或想做的事；这个程度就是衡量效用性的标准

用户体验目标

通常交互式系统包含一个多样性的用户体验目标，涵盖了一系列情绪和感受体验

在特定时间和地点使用或者与一个产品交互时，选择传达用户的感受、目前状态、情绪、感觉等最佳词汇的过程，可以帮助设计者了解用户体验的多面性变化性的本质

可用性和用户体验的关系

体验是主观的而可用性是客观的
矛盾性
- 用软锤打屏幕上的老鼠较用鼠标点击更费劲且容易出错，但体验会更愉快、有趣
有些可用性和用户体验目标是不兼容的
- 设计既安全又有趣的过程控制系统是不可能的也不可取的
认识和理解可用性和其他用户体验目标之间的关系是交互设计的核心

简易可用性工程

四种有效技术

用户和人物观察
场景
边做边说
- 让真实用户在使用系统执行一组特定任务的时候，讲出他们的所思所想
- 最有价值的单个可用性工程方法
- 可了解用户为什么这样做，并确定其可能对系统产生的误解
- 实验人员需要不断提示用户，或请他们事先观摩
启发式评估
- 涉及定量的问题
- 能发现许多可用性问题
- 为避免偏见，应当让多个不同的人进行经验性评估
- 流程：
  - 检查界面
  - 与启发式规则对比列举
  - 列举可用性问题
  - 用启发式规则检查并确认问题

边做边说 $+$ 启发式评估可以发现软件设计中的大部分问题

交互设计原则

8条黄金规则

尽可能保持一致
符合普遍可用性
提供信息丰富的反馈
设计说明对话框以生成结束信息
预防并处理错误
让操作容易撤销
支持内部控制点
减轻短时记忆负担

10条启发式规则

与黄金规则有一定重复，括号内注明

系统状态可见度（3）
系统和现实世界吻合（2）
用户享有控制权和自主权（6， 7）
一致性和标准化（1，8）
避免出错（5）
依赖识别而非记忆（8）
使用的灵活性和高效性（6）
审美感和最小化设计（8）
帮助用户识别、诊断和恢复错误（5，6）
帮助和文档（8）

交互设计过程

课件上找的，不太确定

定义外形因素和输入方法

TBD

定义功能和数据元素

TBD

决定功能组合层次

TBD

勾画大致的设计框架

TBD

构建关键情景场景剧本

TBD

通过验证性场景剧本来检查设计

TBD

交互式系统的需求

需求获取

观察（直接&间接）
场景

用户建模——人物角色

不是真实的人
是基于观察到的那些真实人的行为和动机，并且在整个设计过程中代表真实的人
是在人口统计学调查收集到的实际用户的行为数据的基础上形成的综合原型，拼凑出几个用户档案是不行的
作用：解决产品开发过程中出现的三个设计问题：
- 弹性用户
- 自参考设计（开发者以为用户会按自己预设的想法做事情？）
- 边缘情况设计

人物角色 + 情景 $\rightarrow$ 需求（需求获取：观察 + 场景）

需求验证——原型

低保真原型

多数项目的首选

与最终产品不太相似的原型
优点是简单、快速、便宜、易于制造和修改
三种方式：
- 草图：每张卡片代表一个屏幕或屏幕一部分，经常用于网站开发
- 故事板：一系列草图，展示了用户如何使用该设备完成任务，在设计早期使用，通常与场景一起使用，具有更多细节，并有机会进行角色扮演
- 绿野仙踪法：用户以为他们在与计算系统交互，但实际上是开发人员同他们进行相应

高保真原型

与最终产品更为接近，使用相同材料
制作时间长，难以修改（这也算缺点之一）
风险：用户会认为原型就是系统，开发人员可能认为已经找到了一个用户满意的设计（但实际没有）

层次化任务分析 HTA

Hierarchical Task Analysis

把任务分解为若干子任务，再把子任务进一步分解为更细致的子任务；之后把它们组织成一个”执行次序“，说明实际情况下如何执行各项任务。

评估

评估是设计过程的组成部分
评估是系统化的数据搜集过程
评估侧重系统的可用性和用户体验

评估的原则

评估应该依赖产品的用户，与专业技术人员的水平和技术无关
评估与设计应结合进行，仅靠用户最后对产品的一两次评估无法反映出软件可用性（评估不是设计过程中的一个独立阶段）
评估应在用户的实际工作任务和操作环境下进行，根据用户完成任务得结果，进行客观的分析和评估
要选择有广泛代表性的用户，参加测试的人必须具有代表性

评估范型

快速评估

可以在任何阶段进行
强调“快速了解”，而非仔细记录研究发现，得到的数据通常是非正式的、叙述性的
是设计网站时常用的方法
基本特性：快速

可用性测试

用户测试，DECIDE评估框架

评估典型用户执行典型任务时的情况，包括出错次数、完成任务的时间等
基本特性：在评估人员的密切控制下实行
主要任务：量化表示用户的执行情况
缺点：
- 测试用户的数量通常较少
- 不适合细致的数据分析

实地研究

可以对小孩子用户群体进行

基本特征：在自然工作环境中进行
目的：理解用户的实际工作情形以及技术对他们的影响
重难点：
- 如何不对受试者造成影响
- 控制权在用户，很难预测即将发生和出现的情况

预测性评估

研究人员通过想象或对界面的使用过程进行建模，逐步通过场景或基于问题回答的走查法
基本特征：用户可以不在场，整个过程快速、成本较低
启发式评估属于预测性评估

用户测试

DECIDE评估框架

考试的时候要写具体内容，比如”决定评估的总体目标是…“，不能单纯背步骤

六个步骤，分别对应D, E, C, I, D, E

决定评估需要完成的总体目标 Determine
发掘需要回答的具体问题 Explore
选择评估范型和技术 Choose
标识必须解决的实际问题，如测试用户的选择 Identify
决定如何处理有关道德的问题 Decide
1. 保护个人隐私，可签署协议书
2. 指导原则：
  1. 说明研究的目的及要求参与者做的工作
  2. 说明保密事项，对用户 & 对项目
  3. 测试对象是软件，而非个人
  4. 对测试过程的特殊要求，是否边做边说等
  5. 说明是否对过程录像
  6. 用户有随时终止测试的权利
评估解释并表示数据 Evaluate

测试设计

定义目标和问题

目标描述了开展一个测试的原因，定义了测试在整个项目中的价值

目标是对关注点的说明和解答
选择参与者

参与者的选择对任何实验的成功至关重要

了解用户特性有助于选择典型用户，要尽可能接近实际用户

通常要平衡性别

至少4 ~ 5位，5 ~ 12位就足够了（视情况而定）
1. 参与者安排
  - 各种实验情形的参与者不同
  - 各种情形的参与者相同
  - 参与者配对
2. 参与者不同
  - 随即指派某个参与者组执行某个实验情形
  - 缺点：参与者要足够多，结果可能受个别人影响（解决：随机分配/预测试）
  - 优点：不存在”顺序效应“，即参与者在执行前一组任务时获得的经验将影响后面的测试任务
3. 参与者相同
  - 相同的参与者执行所有实验情形
  - 与前一种方法相比，它只需要一半的参与者
  - 优点：
    - 消除个别差异的影响
    - 便于比较参与者执行不同实验情形的差异
  - 缺点：
    - 可能产生”顺序效应“
    - 解决方法：均衡处理，即如果有两项任务A和B，应让一半参与者先A后B，另一半先B后A
4. 参与者配对
  - 按用户特性（技能/性别）把两位参与者组成组成一组，再随机安排他们执行某一种实验情形
  - 适用于参与者无法执行两个实验的情形
  - 缺点：结果可难受一些未考虑到的变量影响
设计测试任务
- 测试任务应当与定义的目标有关
- 通常是简单任务
- 有时采用复杂任务
- 任务不能仅限于测试的功能，应使用户全面的使用设计的各个区域
- 每项任务时间介于5 ~ 20分钟
- 应当以合乎逻辑的方法安排任务
明确测试步骤
- 测试前准备测试进度和说明，设置好设备
- 正式测试前先进行小规模测试
- 评估人员必要时询问参与者遇到了什么问题
- 若用户确实无法完成某些任务，继续下一项
- 测试过程控制在1小时以内
- 必须分析所有搜集到的数据
数据搜集
- 确定如何度量观测的结果
- 使用的度量类型（定性/定量）依赖于所选择的任务
- 常用的定量度量：
  - 完成任务的时间
  - 停止使用一段时间后完成任务的时间
  - 执行某项任务出错次数和类型
  - 单位时间出错次数
  - 求助帮助的次数
  - 犯某个特定错误的次数
  - 成功完成任务的用户数

为什么进行显著性检验

个体的结果不能代表群体

当面对庞大的群体时我们不得不进行抽样检测，但是样本的结果又不能代表全体

因此显著性检验帮我们确定将样本的结果推广到全体的把握有多大

评估实验的流程

大致如下：

确定测试用户群体
开展小规模预实验
使用DECIDE框架开展实验

一个实例——图标设计评估

自变量：
- 图标的样式
- 自然的和抽象的
因变量：
- 关心用户记忆精确性方面的性能？还是记忆速度方面的性能？还是用户偏爱等主观度量？
- 假设选择一个图标的速度是记忆容易程度的一个指标
  - 在选择中错误的数目
  - 选择一个图标所花费的时间

注：去课件上看一遍该例子完整的实验设计，还有另一个例子——网站评估实例

交互系统的设计策略

四个策略

删除
- 删除不必要的
组织
- 组织要提供的
隐藏
- 隐藏非核心的
转移
- 卡片分类

交互设计的模型和理论

模型

预测模型

能偶预测用户的执行情况，但不需要对用户做实际测试
特别适合用于无法执行用户测试的情形

GOMS

Goal 目标，Operator 操作，Method 方法，Selection-Rule 选择规则
- GOMS认为方法的选择不是随机的
最著名的预测模型
基于人类处理机模型
是关于人类如何执行认知—动作型任务以及如何与系统交互的理论模型
优点：能够容易地对不同界面或系统进行比较分析
局限性：
- 假设用户完全按一种正确的方式进行人机交互，没有清楚地描述错误处理过程
- 只针对那些不犯任何错误的专家用户
- 任务之间的关系描述过于简单
- 忽略了用户间的个体差异

KLM击键层次模型

对用户执行情况进行量化预测，仅涉及任务性能的一个方面：时间
用途：
- 预测无错误情况下专家用户在一系列输入前提下完成任务的时间
- 便于比较不同系统
- 确定何种方案能最有效地支持特定任务
但没有考虑一下内容：
- 错误、学习性、功能性、回忆、专注程度、疲劳、可接受性等

放置M的启发式规则

访问长时记忆区前的操作需要一个M，比如输入字符串、鼠标移动到某处（见下）
先在所有K和P操作前放置M
- $K \rightarrow MK;~ P \rightarrow MP$
删除键入单词或字符串之间的M
- $MKMKMKMK \rightarrow MKKKK$
删除复合操作之间的M（如鼠标选中 $+$ $+$ 点击）
- $MPMP_1 \rightarrow MPP_1$

总结：输入字符串之前需要一个M，P和D之前需要一个M

理论

Fitts定律

能够预测使用某种定位设备指向某个目标的时间
人机交互中，根据目标大小及到目标的距离，计算指向该目标的时间，可以指导设计人员设计按钮的位置、大小和密集程度
对GUI（图形化用户界面设计）有指导意义

Fitts定律使用建议

大目标、小距离具有优势
大目标：
- 屏幕元素应当尽可能多的占据屏幕空间
- 屏幕元素要尽可能利用屏幕边缘的优势
小距离：
- 最好的像素是光标所处的像素
大菜单比如饼型菜单，要比其他类型的菜单使用简单