卡片分类:如何进行数据分析

 前情提要 

本周我们介绍第四种用研方法:卡片分类。已经推送的内容有:

  1. 卡片分类的基本概念和类型选择

  2. 如何准备卡片分类;

  3. 如何执行一次卡片分类活动。

假设你已经收集卡片分类数据,今天我们聊聊如何对其进行分析。

卡片分类所收集的数据,基本可算半结构化数据,可以通过人工汇总、聚类分析、因子分析、路径分析等方法进行分析。

无论使用何种方法,基本思路是一致的:研究分类对象之间的相似性,确定对象间的最佳分类方式。

无论卡片分类在收集数据时是采用人工还是程序,最后进行数据分析时通常都建议使用软件。且经验表明,专业的卡片分类分析软件比通用的统计软件(如SPSS)或电子表格(如Excel)更加简便高效。卡片分类分析软件可以在网上找到免费版。

1人工汇总

当参与卡片分类的用户数很少(不多于4名)、卡片数也较少时,可以直接进行人工汇总。但当用户人数增加时,人工统计容易出现偏差。

由于用户和卡片数量较少,甚至扫一眼已知大概结论,分析所需的时间也非常有限,因此人工汇总可以非常快捷。

下图是4个用户对交通工具的卡片分类示例,很容易用人工得出分析结果。

  1. 两名用户创建了5个分类,1名用户创建4个分类,1名用户创建3个分类。

  2. 所有用户都将以下对象放在同一分类:

    1. 海面/水面/船:游艇;帆船;渡船

    2. 空气/翅膀:飞机;直升机

  3. 用户对“出租车”的分类结果不同。

人工汇总属于非正式分析方法,有助于快速找出结果中需要关注或重点研究的对象。上例中,“出租车”需要重点研究,因为用户对它的分类归属具有争议。

2相似矩阵

相似矩阵(又称距离矩阵),是指从用户角度评估每两个数据点之间的相似程度。

如下图所示,通过观察可以推测:在用户眼中,“飞机”和“直升机”属于相似概念,而“游艇”和“徒步”则属于不同概念。

对相似矩阵进行定量分析前,需要建立单纯矩阵。你可以用Excel或类似软件创建一个表格:

  1. 为每位用户创建一个单纯矩阵,再创建一个数据汇总表。

  2. 在横向和纵向列出所有分类对象,顺序相同。

  3. 如果用户没有把横向、纵向的对象分类在一起,则在相交单元格中填入0,例如在“飞机”和“自行车”相交的单元格填0;反之,如果用户把横向、纵向对应的对象分类在一起,则在相交单元格填1,例如在“飞机”和“直升机”相交的单元格填1。

  4. 每位用户的单纯矩阵填好后,在汇总表中将各自表格中的数据相加。例如,用户1、2、4都将“徒步”和“自行车”放在同一分类,因此相交单元格总和是3。

  5. 将所有数据进行量化和汇总后,可以清晰地看到分类情况,最常在一个分类中的对象则数字更大,反之则数字更小。

  6. 在聚类分析、卡片分析程序、统计程序等软件中,可以导入这些数据。

3聚类分析

聚类分析基于卡片组合在一起的频率,分析两张卡片之间的关系强度,从而量化卡片分类所收集的数据 。

也就是说,通过取类分析明晰:哪些对象经常分在一起,从而说明它们具有相似性;哪些对象很少放在一起,从而说明它们的差异性。

聚类分析的结果通常用树形图表示。

所有分类对象在树形图中垂直排列,排列顺序反应了对象的相似性,越接近的相似度越高。通过对象延伸出的水平线可以看出分类之间的层级和包含关系。例如,“徒步”和“自行车”放在一个小类,而它们与“出租车”一起放在一个大类。

聚类分类通常用软件进行。不同的的软件,在分析时使用的运算方法略有不同,但多数使用合并法:首先将每个对象视为分类中只有它自己,然后计算对象之间的差异性得分,使它们两两成对,差异性小的放在一个分类,最终形成相似矩阵。

今天我们讨论了卡片分类的数据分析,包括3个方法:

  1. 人工汇总;

  2. 相似矩阵;

  3. 聚类分析

发表评论

电子邮件地址不会被公开。 必填项已用*标注

Fill out this field
Fill out this field
请输入正确的电子邮件地址。
You need to agree with the terms to proceed

菜单