在日常业务场景中,我们经常会接触到客户交易明细类数据,这类数据一般由客户编号(id)和所购商品名称两列构成。当需要将商品信息由垂直方向的逐条记录转换为水平方向的多列展示时,虽然excel的数据透视表功能可以实现该需求,但在处理海量交易记录时,往往会出现响应迟缓、卡顿甚至崩溃的情况。此时,spss modeler中的“设为标志”节点便成为一种更优的替代方案。该方法不仅显著提升数据宽表化效率,还能生成标准化的二值结构化格式,为后续开展购物篮分析、关联规则挖掘等深度分析奠定坚实的数据基础。
1、 本案例的数据源为一个Excel表格,已完成导入操作。

2、 在界面左上区域可启用预览模式以快速查看数据样例;“类型”选项卡支持对各字段的数据类型进行定义与调整。其中,作为分类依据的商品字段需设置为“名义”或“有序”类型,并确保其取值被系统准确识别。

3、 从节点面板中拖入“设为标志”节点,并将其与上游的数据源节点建立有效连接。

4、 双击打开“设为标志”节点配置界面,在字段列表中选定代表商品名称的变量,其全部唯一取值将自动呈现在下方“可用设置值”区域中。

5、 利用键盘方向键或鼠标点击方式选取目标商品值,并添加至“创建标志字段”输入框内;默认生成的布尔标识值为“T”与“F”,用户可根据项目规范自定义为“1/0”、“是/否”等其他形式。

6、 将客户ID指定为分组汇总的关键字段,从而确保每位客户仅生成一行宽表记录。

7、 连接“表格”节点至输出端并执行运行流程。

8、 最终输出结果如图所示,实现了客户维度下各商品购买情况的横向展开。











