Làm thế nào để xây dựng một Data Product?

Làm thế nào để xây dựng một Data Product?

Data Product – sản phẩm dữ liệu, được hiểu là một sản phẩm có khả năng thương mại sau khi được phân tích, tổng hợp, điển hình nhất chính là công cụ tìm kiếm Google mà chúng ta sử dụng hàng ngày, hay trang thương mại điện tử Amazon. Người dùng càng tìm kiếm, Google càng cung cấp các kết quả chuẩn xác hơn, tương tự cách mà Amazon ngày càng hiểu khách hàng muốn mua gì. Các công ty này thu thập dữ liệu lớn (Big Data), tối ưu hóa rồi “tái cung cấp” dữ liệu mới tới cộng đồng. Báo cáo của Viện nghiên cứu Toàn cầu McKinsey tại Mỹ (năm 2011) ước tính, việc khai thác dữ liệu cá nhân đem lại giá trị 600 tỷ đô la Mỹ mỗi năm, đồng thời giúp các nhà bán lẻ gia tăng 60% lợi nhuận hoạt động (Operating Margin).

Mặc dù các khái niêm về dữ liệu lớn, sản phẩm khai thác giá trị gia tăng từ dữ liệu mới chỉ xuất hiện tại Việt Nam vài năm trở lại đây. Nhưng trái với nhầm tưởng, không cần phải có một tiềm lực mạnh mẽ như các công ty công nghệ toàn cầu, các doanh nghiệp nhỏ hơn cũng hoàn toàn có cơ hội giải quyết được những nhu cầu cốt lõi từ người dùng, bằng cách xây dựng những phiên bản Data Product tinh gọn. Tiến sĩ công nghệ trí tuệ nhân tạo (AI) Lê Công Thành, Chủ tịch CTCP công nghệ Chọn lọc thông tin (Infore Technology) đã chia sẻ với Doanh Nhân về quy trình xây dựng một Data Product.

Ông Thành cho rằng, điều trước tiên cần nắm bắt khi muốn xây dựng một Data Product là không nhất thiết phải xuất phát từ Big Data, mà nhiều khi chỉ cần những tệp dữ liệu rất nhỏ nhưng có giá trị với khách hàng. Chẳng hạn, dữ liệu phân tích sở thích của 1.000 người đang sở hữu các căn hộ cao cấp Vinhomes sẽ vô cùng giá trị với các doanh nghiệp cung cấp sản phẩm xa xỉ.

Giai đoạn 1: Lựa chọn bài toán

Xác định mong muốn của người dùng hoặc khách hàng cho Data Product đòi hòi các nhà quản lý sản phẩm (Product Manager), đội nghiên cứu trải nghiệm người dùng (UX), chuyên gia phân tích dữ liệu (Data Analyst, Data Scientist) và các nhà lãnh đạo phải cùng tìm ra điểm giao về những quan điểm phát triển sản phẩm, kinh doanh với khả năng công nghệ và phân tích dữ liệu.

 

Chuyên gia khoa học dữ liệu Emily Glassberg Sands của công ty công nghệ giáo dục Coursera (Mỹ) trong một bài phân tích trên trang Havard Business Review đã chỉ ra 3 cách để liên kết các nhóm này trong một doanh nghiệp:

  • Cho phép các nhà khoa học dữ liệu tiếp cận dữ liệu thô (thông thường người tiếp cận dữ liệu gốc lại là Data Analyst – những người ít biết về các ngôn ngữ lập trình, mà làm việc chủ yếu trên excel). Nhằm đưa ra các phương án thuật toán khai thác dữ liệu hiệu quả nhất.
  • Chỉ dẫn cho các nhà khoa học dữ liệu về nhu cầu của người dùng và doanh nghiệp.
  • Đưa ra các chương trình tập huấn về việc đọc dữ liệu ở các bộ phận chuyên môn khác như nhân viên kinh doanh, phát triển giao diện người dùng (UX),… Khả năng đọc dữ liệu của những bộ phân này càng tốt thì các bộ phận kỹ thuật, phân tích dữ liệu càng phát huy tối đa chất lượng của Data Product.

Giai đoạn 2: Xây dựng sản phẩm

Ông Thành gợi ý 4 bước trong quy trình xây dựng sản phẩm dữ liệu:

  1. Đánh giá chất lượng: dữ liệu có thể rất lớn nhưng chưa phải dữ liệu có chất lượng, do đó cần lọc, phân loại, đánh giá các mẫu, gắn nhãn,… để có một khối dữ liệu đủ tốt cho yêu cầu của thuật toán.
  2. Lưu trữ dữ liệu: ở bước này cần đảm bảo (i) khả năng truy xuất dự liệu khi cần (search), và (ii) tốc độ lưu (index). Ngoài ra, dữ liệu được lưu còn cần đảm bảo sự toàn vẹn – các doanh nghiệp nên áp dụng các phương pháp như lưu trữ dư thừa (sharding and replicating).
  3. Phân tích: lúc này là vai trò của các chuyên gia phân tích và chuyên gia khai thác dữ liệu, bằng các công cụ thuật toán trí tuệ nhân tạo như Machine Learning, Data Mining,…
  4. Xây dựng sản phẩm để biểu diễn dữ liệu: đây là phần việc của các nhà nghiên cứu trải nghiệm người dùng, và bộ phận kinh doanh. Sau khi đã đưa ra các phân tích dữ liệu, những câu chuyện dữ liệu (data story) các bộ phận còn lại cần làm việc tiếp nhằm đưa ra một sản phẩm có tính thương mại, thuyết phục được khách hàng.

Lời khuyên của ông Thành với các doanh nghiệp là hãy cân nhắc nhắm đến xu hướng cá nhân hóa của xã hội tương lai để chọn ra những bài toán phù hợp năng lực giải đáp của mình. Khi AI “chín muồi” trong khoảng 6-10 năm tới, mỗi người sẽ trở thành một ông chủ thực sự, và con người sẽ có nhu cầu sử dụng các Data Product khai thác trong 12 lĩnh vực mật thiết đến cá nhân như sau:

  1. Cá nhân hóa việc chữa bệnh (personalized medicine): mỗi người một đơn thuốc, một phương pháp chữa bệnh riêng phù hợp với thể trạng, bệnh trạng, hệ gen của từng người.
  2. Cá nhân hóa giáo dục (personalized education): mỗi người một chương trình đào tạo, nội dung đào tạo riêng, thích hợp với thiên hướng tiếp thu và phông nền kiến thức của từng cá nhân.
  3. Cá nhân hóa thương mại điện tử (personalized ecommerce): điều mà Facebook, Google, Amazon và nhiều bên khác đã và đang làm rất tốt.
  4. Cá nhân hóa thực phẩm (personalized food): giống như cá nhân hóa chữa bệnh nhưng thay thuốc bằng thực phẩm.
  5. Cá nhân hóa tin tức (personalized news): mỗi người được robot cung cấp các dạng thông tin phù hợp với mong muốn, sở thích, mối quan tâm và phông nền kiến thức.
  6. Cá nhân hóa không gian (personalized space): mỗi người có không gian sống, làm việc và di chuyển khác nhau, phụ thuộc thói quen, sở thích của từng người. Cùng là 1 cái bàn nhưng bạn A ngồi thì bàn tự thấp xuống, bạn B ngồi thì bàn tự cao lên là một ví dụ của việc cá nhân hóa không gian sống.
  7. Cá nhân hóa quan hệ xã hội và cộng đồng (personalized network and community): bạn A làm marketing sẽ được máy tính gợi ý xây dựng, duy trì mối quan hệ xã hội với những ai cũng làm marketing và nên hạn chế quan hệ với những thực thể nào khác. Người ta cũng sẽ được máy tính gợi ý và quản lý giúp các cộng đồng họ tham gia.
  8. Cá nhân hóa công việc (personalized job): xã hội trong tương lai gần có thể không có các nghề giống nhau như hiện nay nữa mà mỗi người sẽ làm một thứ lai giữa những công việc cơ bản nhưng phù hợp nhất với họ và do máy tính chỉ định.
  9. Cá nhân hóa tài chính (personalized financial): chi tiêu vào đâu, đầu tư cái gì, kiếm tiền ra sao đều sẽ được máy tính ghi nhớ và giúp từng người tối ưu, ra quyết định.
  10. Cá nhân hóa đức tin (personalized religion): các tôn giáo có thể bị suy giảm dần, thay vào đó một người có thể tin vào một số điều trọng đạo Phật, một số điều trong đạo Cơ đốc và một số điều ở đạo Hồi, tùy theo máy tính phân tích tâm thần và hiểu biết của họ và gợi ý, diễn giải cho họ.
  11. Cá nhân hóa thứ hạng xã hội (personalized ranking): mỗi người sẽ có một thứ bậc xã hội khác nhau, chia làm từng nhóm ngành nghề.

Doanh nghiệp cần chuẩn bị những gì?

Nhân lực: Giá trị của một Data Product nằm ở kiến thức định hướng trước khi phân tích dữ liệu. Do đó, việc xây dựng Data Product là câu chuyện làm việc nhóm. Mỗi người trong nhóm xây dựng sẽ đưa ra góc nhìn và định hướng khai thác khối dữ liệu theo cách khác nhau. Vì vậy, để có một sản phẩm tốt, cần có đủ nhân lực am hiểu về dữ liệu, bao gồm các chuyên gia phân tích (trên nhiều lĩnh vực như marketing, tài chính, sản xuất,…), chuyên gia khai thác,…

“Dữ liệu đầu vào ở đâu?”: Tại Việt Nam chưa nhiều doanh nghiệp quan tâm đến nguồn, tuy nhiên cùng với đà phát triển và hội nhập, việc tìm ra nguồn dữ liệu phù hợp với bài toán là chuyện lớn; yếu tố liên tục, bản quyền cũng phải cân nhắc tới.

Hạ tầng: Việc xây dựng Data Product đòi hỏi tính an toàn, và quy trình quản lý dữ liệu chặt chẽ, nên tất yếu đòi hỏi doanh nghiệp phải bỏ ra ngân sách không nhỏ.

Ông Thành là Chủ tịch CTCP công nghệ Chọn lọc thông tin (InfoRe Technology), doanh nghiệp chuyên ứng dụng trí tuệ nhân tạo trong việc thu thập và phân tích dữ liệu. Một trong hơn 30 dự án ứng dụng trí tuệ nhân tạo tiêu biểu của InfoRe Technology là sản phẩm SMCC.VN - hệ thống đang xử lý trên 30 triệu nội dung thông tin từ mạng xã hội mỗi ngày. Ông thành lấy bằng tiến sĩ ngành Trí tuệ Nhân tạo tại Đại học Paris XI (Pháp), và trở về Việt Nam thành lập InfoRe Technology từ năm 2011.
Với nền tảng chuyên ngành báo chí đa phương tiện, ông Dũng chịu trách nhiệm sản xuất các loại hình báo chí tương tác như Mega Story, Interactive Infographic và các bản tin Video trên môi trường trực tuyến, cũng như thực hiện bài viết cho bản in của Tạp chí Doanh Nhân.

Bài viết liên quan

99% dữ liệu khách hàng Netflix chỉ là rác, làm thế nào để có một tập dữ liệu chất lượng?

99% dữ liệu khách hàng Netflix chỉ là rác, làm thế nào để có một tập dữ liệu chất lượng?

Ngày nay, không chỉ có các công ty nghiên cứu thị trường mà đến bất cứ doanh nghiệp, dịch vụ nào cũng muốn sở hữu một khối lượng lớn dữ liệu khách hàng cho riêng mình. Với tiêu chí “thà giết nhầm còn hơn bỏ sót”, rất nhiều công ty phạm phải sai lầm lấy quá nhiều dữ liệu về rồi không biết sắp xếp, không biết cách sử dụng, không dùng đến, gây thất thoát về cả nhân lực, thời gian và cơ sở vật chất.

Tin tứcNgười đăng Doanh nhan
Eway trên đường tới top 3 châu Á

Eway trên đường tới top 3 châu Á

Với mục tiêu xây dựng một hệ sinh thái hoàn chỉnh về tiếp thị liên kết (Affiliate Marketing) trên nền tảng dữ liệu lớn (Big Data) được xây dựng và phát triển trong nhiều năm, Eway  đang cung cấp ra thị trường các sản phẩm phân phối và quảng cáo hỗ trợ nhiều doanh nghiệp nhằm chọn đúng khách hàng và bán hàng hiệu quả.

Đối thoạiNgười đăng Doanh nhan