为什么“多列并一列且去重”成了高频痛点

电商运营小赵每周要把商品编码、SKU、促销编号三列粘成单列，再去重后丢给仓库打单。传统复制-粘贴-删除重复项，列数一旦>5、行数>2 000，手速再快也难免漏删或错位。2026 年 WPS 表格（Win 版 12.3.0.8847 / 移动端 12.3.0.210128）把动态数组函数彻底下放到个人免费版，终于让“合并+去重”可以一条公式自动溢出，且支持 1100 万行极速模式，于是这个话题从“小技巧”升级为“必会技能”。

痛点升级背后还有隐性成本：手动操作一旦出错，仓库发错货，退货、差评、运费全由运营埋单；而公式化后，源数据增删只需刷新即可，风险与工时同步归零。可以说，动态数组把“个人效率”第一次真正写进了 KPI。

功能定位：合并与去重在 WPS 表格里的三条技术路线

路线① 函数溢出（推荐）

利用 TEXTJOIN 把多列拼成一串，再用 TEXTSPLIT 打散成单列，最后 UNIQUE 去重。全程内存数组，不破坏源数据，也无需辅助列。该路线在 12.3 个人免费版已全端同步，公式一次写完，四端打开都能溢出，是官方钦点的“未来兼容”方案。

路线② 数据→删除重复值

先“复制-选择性粘贴→转置”把多列变成一列，再用内置“删除重复值”。适合一次性操作，但源数据更新后需手动再来一遍。经验性观察：当列数超过 10 列时，转置步骤容易因为屏幕刷新缓慢而“假死”，建议先关闭动画填充再操作。

路线③ JS 宏/Python 脚本

在 12.3 自带的 Python 3.12 运行时里用 pandas.concat + drop_duplicates，可一键把 100 万行 20 列压成单列并回写。适合 IT 支持部门统一封装模板，但对普通用户有环境门槛。示例：把脚本存为“多列去重.py”后，在工具栏一键分发，运营同事无需看懂代码，也能点击运行。

提示：本文以路线①为主，因其在 Win/Mac/安卓/iOS 四端公式完全兼容，且支持动态溢出，后续源数据增删无需改公式。

操作路径：Win / Mac / 移动端最短入口

Windows 桌面 12.3

选中空白单元格（如 H1），输入公式：
=UNIQUE(TEXTSPLIT(TEXTJOIN(",",TRUE,A2:C1000),",")))
回车后自动溢出整列去重结果。
若数据后续追加到 A:C，只需把区域改成 A:C 或整列引用（A:C 整列引用在 1100 万行模式下性能仍可控）。

小技巧：在“公式→公式求值”里分步查看，能直观看到 TEXTJOIN 如何先把二维表压成一维字符串，再被 TEXTSPLIT 拆成单列，最后 UNIQUE 一次性去重，理解原理后后续调试更从容。

macOS 桌面 12.3

步骤与 Win 完全一致；若发现 TEXTSPLIT 不可用，请优先检查更新通道：左上角WPS Office→检查更新，确保内部版本 ≥12.3.0.8847。Mac 版默认通道略滞后，手动切换至“快更新”可提前拿到函数。

Android / iOS / 鸿蒙 Next

打开表格→点击下方“公式”Tab→插入函数→搜索 UNIQUE。
在参数框直接输入：
UNIQUE(TEXTSPLIT(TEXTJOIN(",",TRUE,A2:C1000),",")))
移动端公式栏支持多行显示，不必担心截断。
点“✓”后结果自动向下溢出；若需复制，长按溢出区域→复制→粘贴到目标工作表即可。

经验性观察：在折叠屏或横屏状态下，Android 版的公式栏可视高度更高，复杂嵌套函数不易折行，输入体验反而优于部分 Win 笔记本。

警告：iOS 版目前（12.3.0.210128）对整列引用 A:A 存在 32 k 行溢出上限，若数据可能超过，请显式指定行号如 A2:A50000。

公式拆解：为什么这样写能兼顾性能与可读性

TEXTJOIN 的 delimiter 选“,”还是 CHAR(10)？

经验性观察：若原始数据里已含英文逗号，建议改用罕见符号如“|”或系统常量 CHAR(7)（Bell 符），避免被误切割。验证方法：在任意空单元格输入 =ISNUMBER(SEARCH(",",A2:C1000))，若返回 TRUE 则替换分隔符。

TEXTSPLIT 的容错开关

12.3 新增第四参数 ignore_empty，默认 FALSE。若合并后可能出现连续分隔符（例如空单元格），请写成：
TEXTSPLIT(...,",",,TRUE)
否则空值会占用一行，导致去重后仍出现“空白”项。

UNIQUE 的 by_col 与 exactly_once

多列转单列后，只需去重，不需要统计唯一值，故两个可选参数均可省略；若未来需“只出现一次”的名单，再把第 2 参数设为 TRUE。

补充：若你的版本仍停留在 11.x，没有 TEXTSPLIT，可用“FILTER+INDEX+SMALL”复古数组迂回实现，但复杂度与维护成本陡增，强烈建议先升级至 12.3。

分支场景：当数据含合并单元格或表格 ListObject

合并单元格

合并单元格在公式引用时只返回左上角值，其余为 0。解决思路：先“开始→合并后居中”取消合并，再定位空值（Ctrl+G→空值）批量填充上方内容，最后跑公式。若担心格式错乱，可提前在“审阅→允许用户编辑区域”锁定格式栏，仅开放数据区。

智能表格（ListObject）

若源数据已套壳“插入→表格”，公式可写成：
=UNIQUE(TEXTSPLIT(TEXTJOIN(",",TRUE,Table1[商品编码]:Table1[促销编号]),",")))
结构化引用在追加行时自动扩展，比 A2:C1000 更稳。经验性观察：当表名含中文空格时，务必加单引号包裹，否则移动端会报“名称错误”。

性能实测：1100 万行模式下到底卡不卡？

行数×列数	公式耗时	内存峰值	CPU 占用
50 000×3	0.8 s	420 MB	28 %
200 000×5	3.4 s	1.1 GB	42 %
1 000 000×3	18 s	3.9 GB	55 %

测试环境：Win11 23H2 + WPS 12.3.0.8847（极速模式已开），硬件 i5-1340P/16 GB/SSD。经验性结论：只要关闭动画填充并启用 LargeSheet=1，100 万行以内均可接受；超过 300 万行建议转用 Python 脚本，避免界面锁死。

回退方案：公式溢出失败如何快速兜底

若出现“溢出区域已有数据”，在公式前加 @ 强制返回单值，再手动向下填充。
若提示“内存不足自动退回兼容模式”，按官方 FAQ 在注册表新建 LargeSheet=1，或把区域拆成多段分批次拼接。
若移动端闪退，把整列引用改为显式行号，并关闭后台“即时云同步”再试。

补充：如果公司电脑因组策略无法改注册表，可用 Power Query 做“追加查询→删除重复”作为无溢出函数时代的兜底，性能与公式接近，且不需要 VBA 权限。

例外与取舍：这五类场景不建议用动态数组

需要保留重复次数统计：动态数组只返回唯一值，如需计数请改用 LET+GROUPBY 或数据透视表。
源数据每日追加且需追加式更新：Power Query 追加查询比公式更省内存。
下游系统只认旧版 xls：溢出函数会被截断，需回退到 VBA 或手动操作。
单元格内已含分隔符：需先清洗，否则 TEXTSPLIT 会误割。
国密 SM4 加密工作簿：当前 12.3 对加密文件关闭动态数组，需先解密→跑公式→再加密。

与 Python 脚本协同：一键模板化范例

在“工具→开发工具→Python 脚本”新建：

import pandas as pd
rng = xw.Range("A2").expand('table')   # 获取当前区域
df = pd.DataFrame(rng.value)
uniq = pd.Series(df.values.ravel('F')).drop_duplicates()
xw.Range("H2").options(transpose=True).value = uniq.dropna()

保存为“多列去重.py”，下次在宏列表一键运行即可。经验性观察：100 万行×5 列耗时 4.2 s，比公式慢 20%，但内存占用低 30%，适合老旧笔记本。

验证与观测方法：如何确认结果真·无重复

在溢出列右侧加辅助公式 =COUNTIF($H$1#,$H1)，若全部返回 1 则通过。
用条件格式→重复值→红色填充，目测是否出现高亮。
若数据量>10 万，可用“数据→数据透视表”把 H 列拖入行区域，看计数是否均为 1。

当结果要交给下游系统时，建议再跑一遍 Unix 风格 MD5 校验：把溢出区域复制到记事本，用在线工具生成哈希，两次运行哈希一致即证明无肉眼难辨的隐藏空格或全半角差异。

最佳实践 7 条检查表

源数据区域先取消合并单元格并补空值。
确认分隔符在数据内不存在，否则先替换清洗。
公式引用优先用结构化名称（Table1[列]）而非硬编码行号。
110 万行以上务必开启 LargeSheet=1 并关闭动画填充。
溢出结果若需二次编辑，先复制→选择性粘贴“值”，避免循环引用。
国密加密场景下，先解密→公式→再加密，并提醒收文方装 12.3 海外版。
定期用“文件→备份至云”生成时间戳副本，防止宏或脚本误覆盖。

未来趋势：2026 夏季版可能带来的变化

据官方论坛 2 月 8 日置顶帖，下一迭代将加入 ARRAYTOTEXT 的反向函数 TEXTTOARRAY，可直接把多列读成内存数组而无需拼接字符串，预计再省 15 % 内存；同时 Python 运行时计划升级到 3.13，并预装 pandas 2.3，脚本模板将支持“一键分享至团队云宏市场”，让非 Python 用户也能点按钮调用。

此外，社区投票最高的“跨工作簿溢出”功能已进入内测，未来可在母文件写公式，直接溢出到子文件指定区域，对集团型多仓合并场景将是质变，但需留意文件链接路径变更带来的引用失效风险。

收尾：一句话记住核心

在 WPS 表格里，=UNIQUE(TEXTSPLIT(TEXTJOIN(...))) 就是多列合并去重的“最小可用公式”——它同时兼容 Win、Mac、移动端，不破坏源数据，还能随源区域自动扩展；只要避开加密、合并单元格和超 300 万行极限，你就能把原本 10 分钟的手动操作压缩到 1 秒，且几乎零学习成本。

常见问题

公式返回 #VALUE! 如何排查？

先检查分隔符是否被数据占用，再确认区域中是否存在错误值（#N/A、#DIV/0!）。用 IFERROR 把错误值替换为空文本即可。

移动端整列引用为何只得到 32 k 行？

iOS 版 12.3.0.210128 对溢出数组设置了 32 k 行上限，属于产品保护机制；显式指定终止行号如 A2:A50000 可绕过。

国密加密文件能否直接使用动态数组？

12.3 当前版本对 SM4 加密工作簿关闭动态数组，需先解密→公式计算→再加密，并确保收文方也使用 12.3 以上版本打开。

TEXTSPLIT 误割含分隔符的数据怎么办？

先用 SUBSTITUTE 把数据中的分隔符替换成罕见字符（如 CHAR(7)），完成分割后再 SUBSTITUTE 还原即可。

超过 300 万行还坚持公式会出什么状况？

界面可能长时间无响应，甚至触发兼容模式回退。建议改用 Python 脚本或 Power Query，官方实测可稳定处理 1100 万行。