脏数据有什么危害?CDP如何解决脏数据带来的业务问题
401人已读
发布于:2023-07-26 23:30:14
目录
低质量数据造成的错误
脏数据对营销人员的影响
但是那些数据科学家呢?
对于您的工程团队来说,糟糕的数据会损失多少信任和成本赤字
CDP 如何帮助处理错误数据?
总结
本文将主要讨论脏数据是什么、如何产生,如何借助CDP的力量降低低质量数据的影响。净的数据会带来更强有力的商业决策,更多的个性化营销活动。

如果你个人受到脏数据的伤害,请举手。我知道我有。每天有2.5千兆字节的数据被创建。这个数字是2.5乘以十亿,肯定会有一些错误。

我所说的错误,是指糟糕、质量差的数据——不准确、不完整、无格式化、不相关或重复的信息。在整个博客中,我将交替引用这些术语,但请记住,它们各自构成了自己独特的一组问题。

很容易产生不准确的数据。也许你做了一个在线化名来下载一个快速 PDF,或者你有一个临时帐户。或者你只是在提交表格时打错了字。虽然无伤大雅,但这个错误信息附带了一笔钱。

在美国,低质量数据的年度成本为3.1万亿美元(T 开头)。因此,如果你认为你的公司没有错误的数据,你很可能只是还没有找到它。

低质量数据造成的错误

为了扩展这个博客的第二句话,我也有过处理低质量数据的经验。为了设定场景,我给我们在美国的所有客户发了电子邮件,邀请他们参加一个大型活动。一个非常重要的客户,我会叫他维克,从来没有收到我的电子邮件邀请。当我们销售团队的一名成员路过我的办公桌时,我发现了这一点(还记得那些日子吗?)问我为什么把维克排除在邀请之外。

混乱接踵而至,导致了其中一个“停止你正在做的事情,让我们尽快解决这个问题”的故障排除时刻。也许 Vic 没有订阅,也许 CRM 的服务器坏了。我发邮件了吗?

为了加快速度,我们深入到我们的 CRM 数据库,发现 Vic 的国家被写成了“ USA”我发出的电子邮件邀请函被设置为基于字段的客户列表,“ Country 字段包含‘ United States。”

Contact-country-view

事实上,我们有这么多不同的条目,同一个国家在同一个领域意味着我们有一个肮脏的数据问题。虽然处理这些数据很不幸,也很费时间,但是这些数据的根本原因并不是不合理的。

我们的一些客户输入我们的客户关系管理从网络表单中的国家领域是从下拉列表中选择。还有一些是在现场活动中扫描徽章时发现的,在那里没有标准的方式进入你的国家。我们让客户通过网络研讨会、博客订阅、甚至 SDR 手动将条目输入到我们的 CRM 中来进入我们的系统。

低质量或非标准化的数据影响营销人员,因为它影响他们与客户沟通的方式。

让我们深入了解营销人员依赖于低质量数据的现实世界的影响。

脏数据对营销人员的影响

根据我们2022年的“个性化状态报告”,62% 的消费者表示,如果一个品牌提供的是非个性化的体验,他们就会失去忠诚度。这给营销人员施加了更大的压力,要求他们发送正确的信息,为每个独特的客户量身定制。

向客户发送错误信息会损害他们与你的品牌的关系。当你发送一封电子邮件到错误的列表(例如。邀请澳大利亚客户参加在维也纳举行的活动) ,你就有可能陷入垃圾邮件陷阱。你发送的电子邮件质量越差,你的电子邮件流失率就越高,因为客户失去了兴趣,体验也不怎么样。

无私的顾客只是冰山一角。当你开始失去客户的信任时,你的品牌价值就会受到侵蚀。如果你的客户认为你的内容武断或者更糟糕,令人讨厌,他们会退订或者把他们的业务转移到其他地方——也许是你的竞争对手。不要忘记,新客户的成本是留住现有客户的5倍。最好不要冒失去忠实客户的风险。

营销人员非常努力地建立对自己品牌的信任。一旦信任建立起来,他们就可以开心地尝试新的竞选理念。他们应该得到更好的待遇,而不是让他们的辛勤工作被糟糕的数据所篡夺。

但是那些数据科学家呢?

糟糕的数据不仅通过与客户的互动损害了营销人员的声誉。它还会影响组织的内部工作,这会产生深层次的后果。

福布斯在2016年分享数据科学家花费60% 的时间清理和组织数据。

我认为,我们都同意,公司花大价钱聘请数据科学家来解决复杂的问题和寻找预测。这种60% 的清理和组织数据的工作剥夺了他们其他更独特的角色。当然,他们可以在运行中清理少量数据,但这可能需要几分钟或几个小时,这取决于他们的系统的复杂性,如果他们能够在下游之前发现不一致。

一旦肮脏的数据流向下游,就会对他们的模型造成严重破坏。创建的任何图表都将反映这些糟糕的数据。想象一个国家的柱状图,其中一个柱状图代表美国,另一个柱状图代表美国。当然,任何了解世界地理的数据科学家都可能在这个错误出现之前就发现它,并自己解决它。但如果错误不是那么明显呢?

chart-with-bad-data

数据科学家呈现模型的方式可能会受到坏数据的影响。对于数据科学团队来说,这在内部看起来很糟糕,因为利益相关者可能开始怀疑这些预测。尽管“数据”这个词在他们的名字中字面意思是“数据”,但是当数据本身质量很差的时候,不能指望数据科学家施展魔法并创建精确的图表。

当公司根据错误的数据做出决策时,它会影响组织的底线——预测的收入下降、费用增加,以及对数据科学部门的信任丧失。

对于您的工程团队来说,糟糕的数据会损失多少信任和成本赤字

数据治理在工程组织中起着特别重要的作用。随着组织中更多的团队能够在内部处理和提取数据,数据治理就会减少,出错的空间也会增加。这就在你的工程师周围制造了一个恶性循环。

考虑到这一点,您的数据分析师注意到工具 A 和工具 B 都分析系统中的数据,它们的结果不一致。他们从这两个工具中提取数据的电子表格,手动突出显示差异,并将其提交给工程师。现在,工程师和数据科学家必须花时间证明数据是正确的,或者在其中发现一个错误。

想象一下,当3个小时的研究后,他们发现错误是由于有2个“电话号码”字段和数据分析师抓错了一个!

技术堆栈越复杂,错误数据进入堆栈的可能性就越大。错误越深,解决这些问题的成本就越高。如果没有标准化的数据输入,就会在数据仓库中添加额外的单元格。

在关系数据库中,您提供的列大部分是空的。假设你的大多数表单要求一个电话号码(值电话号码) ,只有一个要求一个家庭电话(值家庭电话)。当您将价值家庭电话引入到数据仓库时,系统中的每个客户现在都有一个字段,即家庭电话,添加到它们中,这个字段大部分是空白的。您正在为空字段分配内存和存储空间。(是的,noSQL 数据库可能会减轻对存储成本的一些担忧。但是如果您的堆栈是围绕传统的 RDBMS 构建的,那么就会遇到容量规划问题。)

生产环境中也存在数据仓库中的错误。如果你曾经乘坐过廉价得令人惊讶的航班,那么你已经从糟糕的数据中获益,同时也给航空公司带来了混乱。通常被称为“错误票价”,当仓库中的数据产生错误的数字时,就会出现这种情况。航空公司可以兑现这些票价,也可以取消这些票价并向客户收取差价。这不仅会激怒客户,而且还需要一位工程师在某个地方疯狂地尝试用数据精确定位和解决问题。

旅游行业有大胆的例子,但几乎每家公司的数据中都隐藏着类似的错误。

CDP 如何帮助处理错误数据?

幸运的是,没有解决方案,错误的数据不是问题。与 Twilio Segment 类似,客户数据平台充当团队数据收集的中心枢纽。数据收集一次,并实时公平地提供给所有下游目的地工具。

LinkFlow 的跟踪计划功能允许您围绕您预期从所有源收集的事件定义规则。构建这些计划需要时间、精力和对业务目标的深刻理解。一旦它们被创建,你的所有团队都在同一个页面上,为他们所使用的数据提供一个参考点/真相来源。

追踪计划使您可以根据交付到段的实时事件验证预期的事件。当事件与跟踪计划中的规范事件不匹配时,就会发生违规。在部分中,您可以深入了解违规情况以及造成违规的原因。如果您发现下游工具中存在问题,这是一种快速调试的方法。

data-validation

您还可以阻止事件一起冲击您的下游工具。

假设您实现了一个输入错误的事件。段使您可以选择发送事件并将其转发到不同的地方进行清理,然后重播,以确保没有数据丢失。您可以阻止与规范不匹配的属性,或者阻止整个事件。使用 Segment 的 Transformations 特性,您可以转换事件名称、属性等等,以防发现生产中的错误。本质上,您正在改变事件“中途飞行”,以符合您的标准。

unplanned-events-properties-values

我们关注的是 LinkFlow 如何实时处理这些数据。它还可以收集历史数据。LinkFlow 提供了一个重播功能,它获取 Segment 数据的存档副本,并将其重新发送到下游工具。

重播可以防止被锁定到任何供应商,否则您将不敢离开,因为您在该工具中累积了所有的历史记录。一旦您设置了任何新工具,您就可以立即获取历史数据,而不需要等待它随着时间的推移进行收集。而且工程师们不需要担心数据从一个工具迁移到另一个工具,这会降低实现新工具的成本。

LinkFlow 的 CDP 提供了一些工具,既可以在调试过程中保存您的团队,又可以实时标记违规行为,以防止疯狂的清理。

总结

我们中没有人能够免疫潜入数据集的错误信息。识别和解决这些脏数据会耗费营销人员、数据科学家和工程师的时间和精力。这也降低了客户对你公司的信任。

投资 CDP 的公司有一个明确的途径来确保数据达到标准,并且看起来像预期的那样。干净的数据会带来更强有力的商业决策,更多的个性化营销活动,更少的变通方案。

如果您希望获得一个详细的概述,深入了解 LinkFlow CDP 对贵公司全域客户运营的价值,您可以通过两种方式获得咨询:
1、点此完成CDP需求自评,不需要专家介入,可以能在3分钟左右快速确定是否需要CDP: http://ln8w.cn/51Kuqa
2、或直接申请1v1咨询通道,与咨询专家完成20分钟左右的需求评估,非常适合目前无法准确描述自身需求、无法确定是否需要一套什么样工具的用户: http://ln8w.cn/4108n5
以上咨询均免费。
Ezra
LinkFlow 高级用户运营经理
擅长全域精细化运营体系搭建,撰写了多篇关于标签体系、用户画像、用户细分、用户触达、精细化运营等文章,并有《全域运营小白直播课》上架LinkFlow微课堂,欢迎报名。
进入作者专栏
0
复制成功

让数据流动起来,开启业绩增长!

了解500+品牌零售商使用LinkFlow的场景用例