[TMATalk-AI Story] Dùng AI để xây dựng hệ thống tìm kiếm thông minh: Từ thách thức đến ngày hái “quả ngọt”

TMAers thích sẻ chia

10/07/2025

Trí tuệ nhân tạo (AI) đang bùng nổ mạnh mẽ, trở thành một trong những công nghệ chủ chốt định hình lại nhiều lĩnh vực - từ tài chính, bán lẻ cho đến giáo dục và đặc biệt là y tế. Với khả năng phân tích dữ liệu lớn, học hỏi liên tục và tạo ra những gợi ý thông minh, AI không chỉ giúp nâng cao hiệu suất làm việc mà còn mang lại những trải nghiệm cá nhân hóa vượt trội cho người dùng.

Nhận thức rõ tiềm năng này, TMA đã liên tục đầu tư vào nghiên cứu và phát triển các giải pháp AI trong những năm gần đây. Từ việc tăng cường đào tạo và xây dựng đội ngũ kỹ sư AI, phát triển các sản phẩm ứng dụng học máy, đến việc tư vấn, ứng dụng AI vào các dự án thực tế cho khách hàng toàn cầu, TMA đang khẳng định cam kết trở thành một trong những đơn vị tiên phong về công nghệ AI tại Việt Nam.

Một trong những dự án tiêu biểu đó của TMA là dự án trong vai trò nhà cung cấp nền tảng công nghệ (Platform Provider) cho một trong bốn công ty bảo hiểm y tế hàng đầu tại Mỹ - nơi phục vụ hàng triệu bệnh nhân mỗi ngày thông qua hệ thống trực tuyến. Tuy nhiên, đằng sau quy mô ấn tượng ấy là một nghịch lý đáng suy ngẫm: công cụ tìm kiếm trên website, vốn là cầu nối quan trọng giữa bệnh nhân và thông tin y tế, lại hoạt động thiếu hiệu quả. Hệ thống tìm kiếm này thường cho ra kết quả không chính xác, không phản ánh đúng nhu cầu người dùng, tốc độ phản hồi chậm và chi phí vận hành lại quá cao do sử dụng giải pháp tìm kiếm thương mại từ bên thứ ba.

Trong bối cảnh AI đang dần thay đổi cách chúng ta tiếp cận dữ liệu và chăm sóc sức khỏe, câu hỏi đặt ra là: Tại sao không tận dụng sức mạnh của AI để xây dựng một hệ thống tìm kiếm mới - chính xác hơn, nhanh hơn, cá nhân hóa hơn và tiết kiệm hơn? Đây không chỉ là thách thức kỹ thuật, mà còn là cơ hội tạo nên bước ngoặt trong việc nâng cao trải nghiệm của bệnh nhân trong kỷ nguyên số.

TMA Solutions

Từ thách thức không hề dễ dàng đến bước ngoặt nhờ sự tận tâm

Nhận bài toán đầy thách thức này từ khách hàng, đội ngũ AI của TMA đã dành hơn một tháng “mổ xẻ” vấn đề, nghiên cứu chuyên sâu để có thể hiểu rõ tính khả thi của dự án, từ khả năng triển khai trên hạ tầng của khách hàng, đến chi phí dài hạn cũng như mức độ rủi ro. Cùng với đó, những công nghệ tiềm năng có thể ứng dụng cũng được toàn team nghiên cứu kỹ lưỡng. Để ưu tiên độ ổn định, tốc độ và chi phí, team đề xuất BERT, MiniLM đến OpenAI, còn về khả năng tích hợp và mở rộng, có thể sử dụng Apache Solr, Elasticsearch đến Azure AI Search. 

Từ những kiến thức và kỹ năng đã “bỏ túi” được trong suốt thời gian đó, team đã thiết kế proposal toàn diện bao gồm dự toán chi phí, thời gian và mức độ khả thi cũng như kiến trúc hệ thống: Event-Driven, Scalable. Cùng với đó là tài liệu chia sẻ từ cơ bản: Vector search là gì? RAG hoạt động ra sao? đến chuyên sâu: Ingestion pipelines, incremental update.

Với sự chuẩn bị kỹ lưỡng, chỉ sau 2 tuần, team đã hái được “quả ngọt” đầu tiên. Tháng 4/2024, proposal được phê duyệt không phải vì ý tưởng “nghe hay”, mà bởi vì team đã cho khách hàng thấy một kế hoạch chi tiết, bài bản về chi phí, thời gian, mức độ khả thi. Kèm theo đó là những bằng chứng kỹ thuật, chiến lược và kế hoạch thực hiện từng bước rõ ràng. Đó là minh chứng cho thấy sự nghiêm túc, chỉn chu trong quá trình chuẩn bị chính là bí quyết đầu tiên của thành công.    

Xây dựng giá trị thực với mục tiêu mang lại hiệu quả vượt trội cho khách hàng

Không dừng lại ở đó, sau khi proposal được phê duyệt, giai đoạn “cày cuốc” miệt mài của team mới thực sự bắt đầu. Trong 3 tháng thực hiện POC (Proof of concept), team đã làm việc không ngừng nghỉ, từ daily meeting để trao đổi kỹ thuật, ưu tiên, rủi ro, cho đến demo định kỳ mỗi 2 tuần (sprint review) để nhận phản hồi từ khách hàng, từ đó liên tục cải tiến để hướng tới một sản phẩm hoàn thiện và chất lượng nhất. Bên cạnh đó, team cũng liên tục giao tiếp với các nhóm nội bộ onshore khác. Với phương châm “không né tránh bất kỳ use case nào, mà luôn tìm cách phù hợp để tích hợp”, team đã không ngừng tìm hiểu, thay đổi, từ upload file (JSON, CSV, PDF, DOCX), website crawling, Nifi workflow đến Kafka streaming để đảm bảo tính hiệu quả. 

Trong quá trình đó, team đã xây dựng được: 

  • Hệ thống micro-services, Ingestion pipelines
  • Bộ APIs hỗ trợ vector-based, keyword-based và hybrid search
  • Tích hợp OpenAI cho việc Embedding, Intent Detection, Reranker, Content Filter
  • Embeddable UI gồm chatbot và Search Bar, có thể dễ dàng chỉnh sửa trên Self-Service Portal và embedded vào website, giảm thiểu thời gian tích hợp cho khách hàng.

Đại diện team chia sẻ: “Overtime là điều không thể tránh khỏi. Tuy vậy, tất cả các thành viên chúng tôi đều không một ai than phiền. Tất cả đều cùng hướng đến mục tiêu chung là mang lại giá trị rõ rệt cho khách hàng.”

Nhờ sự nỗ lực không ngừng, team không chỉ hoàn thành POC đúng hạn mà còn vượt tiến độ kỳ vọng. Cùng với đó, team cũng liên tục tiếp nhận và xử lý các yêu cầu thay đổi chỉ trong thời gian ngắn, mà vẫn đảm bảo chất lượng. Sự “thần tốc” này luôn nhận được những lời khen có cánh từ phía khách hàng. Đặc biệt, Director phía khách hàng còn cho rằng “This is the fastest team I’ve ever seen.” 

Sản phẩm thành hình - Thành quả của sự nỗ lực miệt mài

Tháng 7, 2024, sau thành công của POC, dự án bước sang giai đoạn MVP (Minimum Viable Product). Trong thời gian này, cả team tập trung hơn vào khả năng triển khai và tích hợp như:

  • Tích hợp CI/CD, auto-scaling
  • Tăng cường bảo mật, tính sẵn sàng cao (HA)
  • Backup & Disaster Recovery plan
  • Tracking - Auditing - Metrics Monitoring - Analytics.

Bằng tất cả sự tận tâm của các thành viên, nửa năm sau, đến tháng 4/2025, sản phẩm chính thức ra mắt trên production, được tích hợp trong hệ thống website nội bộ cho bệnh nhân và bước đầu đạt 10.000 truy vấn/ngày từ người dùng thực tế tại Mỹ. Không dừng lại ở đó, nhiều nhóm nội bộ của khách hàng cũng đang chủ động tích hợp với nền tảng trong các môi trường thử nghiệm.

Với những tính năng chính như:

  • Gateway LiteLLM doanh nghiệp: Cung cấp quyền truy cập vào các mô hình ngôn ngữ tiên tiến và một phạm vi rộng hơn của các kho vector trong tương lai.
  • Khả năng tự phục vụ: Cho phép các ứng dụng trên các lĩnh vực khác nhau quản lý dữ liệu, cấu hình giao diện tìm kiếm và thực hiện phân tích sau truy vấn.

Nhờ sự nỗ lực tận tâm cùng thái độ, quy trình làm việc chuyên nghiệp, đội ngũ kỹ sư TMA đã tạo ra 1 sản phẩm vượt trội, giúp khách hàng tăng hiệu suất, giảm chi phí, cải thiện độ hài lòng người dùng, từ đó chứng minh năng lực công nghệ của TMA trong việc tiên phong ứng dụng Trí tuệ nhân tạo (AI) vào mọi lĩnh vực của đời sống.