99% dữ liệu khách hàng Netflix chỉ là rác, làm thế nào để có một tập dữ liệu chất lượng?

99% dữ liệu khách hàng Netflix chỉ là rác, làm thế nào để có một tập dữ liệu chất lượng?

Ngày nay, không chỉ có các công ty nghiên cứu thị trường mà đến bất cứ doanh nghiệp, dịch vụ nào cũng muốn sở hữu một khối lượng lớn dữ liệu khách hàng cho riêng mình. Với tiêu chí “thà giết nhầm còn hơn bỏ sót”, rất nhiều công ty phạm phải sai lầm lấy quá nhiều dữ liệu về rồi không biết sắp xếp, không biết cách sử dụng, không dùng đến, gây thất thoát về cả nhân lực, thời gian và cơ sở vật chất.

Chiến lược Tác giả

Năm 2018, Uber lỗ vận hành tới 3 tỷ USD, nhưng vẫn gọi vốn được 67 tỷ USD. Tương tự, tính từ năm 2014 đến năm 2017, chỉ tính riêng tại thị trường Việt Nam, Grab đã lỗ tới hơn 1.700 tỷ đồng nhưng vẫn “sống tốt” nhờ vào những đợt bơm tiền đều đặn. Lỗ nhưng vẫn được đầu tư là kịch bản diễn ra đối với phần lớn các dịch vụ công nghệ mới như sàn thương mại (Shopee, Lazada…) và gọi xe (Uber, Grab…). Vậy tại sao, nhà đầu tư vẫn chấp nhận? Chính là vì lượng dữ liệu khổng lồ mà Grab, Uber… đang cần mẫn thu thập từ khách hàng hàng ngày.

Khách hàng khi bắt đầu là đã bước vào hệ thống dịch vụ toàn diện, mà mỗi hoạt động, hành vi đều được chuyển hoá thành dữ liệu. Các ứng dụng có thể theo dõi hàng loạt dữ liệu khác như khách hàng đang việc ở đâu, thường đi làm lúc mấy giờ,… Từ đó giúp các doanh nghiệp cá nhân hóa chương trình marketing phù hợp với từng khách hàng hoặc địa phương hóa các chiến dịch quảng cáo… Trong kỷ nguyên cách mạng công nghiệp 4.0, dữ liệu chính là mạch máu duy trì sự sống cho doanh nghiệp.

Tuy giá trị của dữ liệu đối với mỗi doanh nghiệp là điều không cần bàn cãi, nhưng trong một buổi hội thảo mới đây tại Tp.HCM, ông Sơn Lương, Chủ nhiệm bộ phận CARE – CRM, Acquisition, Retention, Extension của công ty Reckitt Benckiser (Việt Nam), đơn vị sản xuất hàng tiêu dùng với những thương hiệu toàn cầu như Durex, Veet, Detol, Finish…cho rằng, rất nhiều doanh nghiệp hiện nay vẫn không biết mình thu thập dữ liệu làm gì, thu thập dữ liệu như thế nào, bao nhiêu là đủ. Việc tối ưu khai thác và sử dụng dữ liệu sau đó, thậm chí còn xa vời hơn.

Hai khía cạnh để đánh giá chất lượng dữ liệu

Ai cũng biết Netflix là một công ty có khả năng thu thập và sử dụng dữ liệu hàng đầu thế giới. Thực tế, nhờ vào khối dữ liệu khai thác từ khách hàng khổng lồ ấy, Netflix thường xuyên tìm ra được những insights vô cùng giá trị và biến chúng thành trợ thủ đắc lực cho việc thiết kế sản phẩm, sản xuất các nội dung và giúp cho công cuộc chinh phục thị trường toàn cầu của mình trở nên nhanh chóng và dễ dàng hơn. Thế nhưng vào năm 2016, Todd Yellin, Phó Chủ tịch về đổi mới sản phẩm của Netflix, lại bất ngờ tuyên bố có đến 99% dữ liệu công ty đang nắm giữ là vô giá trị. “Chúng tôi có cả núi thông tin để vứt đi. Những dữ liệu vàng chỉ chiếm 1% trong số này. Các kiểu thông tin về địa lý, tuổi tác, giới tính… chúng tôi tính là rác hết. Việc bạn đang sinh sống ở đâu thực sự không quan trọng một tí nào”.

Ông Sơn cho rằng việc phân chia đâu là dữ liệu rác, đâu là dữ liệu vàng như vậy hoàn toàn phụ thuộc vào đối tượng khách hàng và ngành nghề kinh doanh của doanh nghiệp. Rõ ràng với những doanh nghiệp như sàn thương mại điện tử, dịch vụ gọi xe, dịch vụ giao hàng thì địa chỉ khách hàng là dữ liệu tối cần thiết, phục vụ trực tiếp cho việc kinh doanh của họ. Thực tế việc thông tin có đáng giá hay không nên được dựa vào hai tiêu chí:

Thứ nhất, tính toàn vẹn của dữ liệu (Data Completeness)

Tính toàn vẹn của dữ liệu hàm ý chỉ liệu có bất cứ lỗ hổng nào trong khối dữ liệu dự kiến thu thập và khối dữ liệu thực tế thu thập được. Để đảm bảo tính toàn vẹn, doanh nghiệp cần:

  1. Cấu trúc dữ liệu rõ ràng: Ví dụ chỉ với dữ liệu về địa chỉ của khách hàng, doanh nghiệp cũng cần phân ra những cột dữ liệu riêng về thành phố, quận, huyện… để tiện cho công việc phân tích sau đó.
  2. Định dạng (format) rõ ràng: Bên cạnh dữ liệu tự thu thập, nhiều doanh nghiệp ngày nay cũng phải sử dụng và kết nối với dữ liệu khách hàng của nhiều bên khác nhau. Ngoài ra, với sự phát triển công nghệ như hiện nay, các công ty có thêm nhiều phương pháp thu thập thông tin (creative, smart targeting…). Do đó, doanh nghiệp ngay từ đầu phải quy định định dạng dữ liệu rõ ràng để kết nối các dạng data này lại với nhau.
  3. Đảm bảo khả năng cập nhât: Thông tin thay đổi liên tục và không bao giờ bất biến. Nó cần được “nuôi dưỡng”, cập nhật liên tục tương ứng. Khi thu thập dữ liệu về, doanh nghiệp cũng cần tính tới chuyện sẽ cập nhật nó trong tương lai như thế nào.

Thứ hai, tính chính xác của dữ liệu (Data Integrity)

Tính chính xác của dữ liệu là việc duy trì và đảm bảo tính chính xác, sự nhất quán của dữ liệu trong toàn bộ vòng đời của nó. Ví dụ như khi thu thập dữ liệu về nơi sinh sống của khách hàng bằng việc điền bảng chẳng hạn, có người sẽ viết hẳn ra là “Thành phố Hồ Chí Minh”, có người viết tắt “TPHCM”, hoặc “HCMC”. Tới lúc doanh nghiệp sử dụng dữ liệu sẽ tốn nhiều công phân loại và thống nhất. Tốt hơn hết là thu thập data dạng số (digital), hoặc xây dựng bảng câu hỏi thành những tickbox/checkbox để thống nhất thông tin. Tiếp đó, doanh nghiệp cũng cần có những biện pháp khuyến khích khách hàng chủ động cập nhật thông tin cho mình, cũng như thường xuyên kết nối với các bên nghiên cứu thị trường khác để làm giàu và kiểm chứng khối thông tin mình đang nắm giữ.

Nguyên tắc thu thập

“Quý hồ tinh bất quý hồ đa”, dữ liệu không cần nhiều mà cốt phải nhằm giúp doanh nghiệp hiểu về khách hàng. Điều này chỉ phát huy tác dụng khi công ty xây dựng chiến dịch và hệ thống quản lý thông tin.

Năm 2016, hãng mỹ phẩm Maybelline New York cùng Google thực hiện một chiến dịch nghiên cứu thị trường chi tiết, giúp xây dựng một chiến dịch quảng cáo nội dung phong phú và cực kỳ hiệu quả. Trước hết, Maybelline xác định cho mình một khung hành trình khách hàng từ lúc bị chú ý, bị kích thích tương tác, quyết định mua hàng và trở nên thân thiết với nhãn hàng (Enroll-Engage-Accquire-Retain). Tại từng bước, thương hiệu mỹ phẩm này lựa chọn ra từng thông tin khách hàng cụ thể và cá nhân hóa cách tiếp cận theo hướng tiện lợi nhất cho khách hàng (qua cửa hàng bán lẻ, qua mạng xã hội, qua dịch vụ video trực tuyến, qua email…). Nhờ vào dữ liệu khách hàng chọn lọc, Maybelline đảm bảo tiêu chí truyền thông “Đúng thông điệp-Đúng đối tượng-Đúng thời điểm-Đúng kênh-Tại tất cả các điểm của hành trình mua sắm” và đạt được mục đích cuối cùng của mỗi doanh nghiệp đó là tăng lượng bán hàng.

Khác với dự án nghiên cứu khách hàng phạm vi hẹp và có chọn lọc như Maybelline, nhiều doanh nghiệp hiện nay lại đang khai thác dữ liệu khách hàng ồ ạt. Việc lấy quá nhiều thông tin, kể cả dữ liệu không dùng đến, như vậy khiến khách hàng vừa không hài lòng, cảm thấy bị làm phiền, vừa khiến những thông tin ấy sau một thời gian lưu trữ mất hết giá trị, không còn dùng được

Thêm nữa, việc khai thác dữ liệu giữa “ma trận” hàng-cột dẩy nguy cơ xảy ra sai sót không mong muốn lên cao. Đây cũng là một phần nguyên nhân giải thích cho việc tại sao Facebook Ads thu phí khảo sát thông tin khách hàng nhiều hơn cho những biểu mẫu ngắn gọn, chọn lọc và thường đem lại ROI cao, hơn là những bảng biểu khảo sát dài, lan man…

Ông Sơn cho rằng để xác định được việc cần thông tin nào, trước hết doanh nghiệp cần trả lời được hai câu hỏi là:

  • Doanh nghiệp cần thông tin đó để làm gì? Nhãn hàng sẽ có được gì nếu có được thông tin ấy?
  • Khách hàng sẽ nhận được gì khi cho bạn thông tin? Tại sao họ phải đưa dữ liệu cá nhân cho bạn?

Khi có câu trả lời, doanh nghiệp nên áp vào bản đồ hành trình khách hàng của mình (Enroll-Engage-Accquire-Retain) để cụ thể hóa tại thời điểm nào thu thập thông tin gì và thông tin ấy sẽ phục vụ vào hành trình ấy như thế nào. Còn đối với việc lựa chọn hình thức khai thác dữ liệu sao cho đúng, qua các kênh physical hay digital thì không có câu trả lời chính xác mà phụ thuộc vào mục đích, năng lực tài chính, con người và quỹ thời gian của mỗi doanh nghiệp.

Bà Hà có bằng thạc sỹ chuyên ngành Báo chí, Truyền thông và Toàn cầu hóa tại đại học Aarhus (Đan Mạch). Với 10 năm kinh nghiệm làm việc trong lĩnh vực báo chí và marketing, bà Hà hiện đang chịu trách nhiệm sản xuất nội dung cho Tạp chí Doanh Nhân bản in, cũng như các tin bài đa phương tiện trên phiên bản trực tuyến.

Bài viết liên quan

Làm thế nào để xây dựng một Data Product?

Làm thế nào để xây dựng một Data Product?

Data Product – sản phẩm dữ liệu, được hiểu là một sản phẩm có khả năng thương mại sau khi được phân tích, tổng hợp, điển hình nhất chính là công cụ tìm kiếm Google mà chúng ta sử dụng hàng ngày, hay trang thương mại điện tử Amazon. Người dùng càng tìm kiếm, Google càng cung cấp các kết quả chuẩn xác hơn, tương tự cách mà Amazon ngày càng hiểu khách hàng muốn mua gì. Các công ty này thu thập dữ liệu lớn (Big Data), tối ưu hóa rồi “tái cung cấp” dữ liệu mới tới cộng đồng. Báo cáo của Viện nghiên cứu Toàn cầu McKinsey tại Mỹ (năm 2011) ước tính, việc khai thác dữ liệu cá nhân đem lại giá trị 600 tỷ đô la Mỹ mỗi năm, đồng thời giúp các nhà bán lẻ gia tăng 60% lợi nhuận hoạt động (Operating Margin).

Tin Nổi BậtNgười đăng Doanh nhan
Eway trên đường tới top 3 châu Á

Eway trên đường tới top 3 châu Á

Với mục tiêu xây dựng một hệ sinh thái hoàn chỉnh về tiếp thị liên kết (Affiliate Marketing) trên nền tảng dữ liệu lớn (Big Data) được xây dựng và phát triển trong nhiều năm, Eway  đang cung cấp ra thị trường các sản phẩm phân phối và quảng cáo hỗ trợ nhiều doanh nghiệp nhằm chọn đúng khách hàng và bán hàng hiệu quả. 

Đối thoạiNgười đăng Doanh nhan