Nghe thật, nói giả: Kỷ nguyên của deepfake

2026/03/22 16:42

GD&TĐ - Công nghệ deepfake khiến thế giới đặt ra câu hỏi về niềm tin và sự an toàn.


Dù mang lại nhiều ứng dụng hữu ích, AI cũng đang mở ra một kỷ nguyên, nơi ranh giới giữa thật và giả trở nên mong manh hơn bao giờ hết.

Lừa đảo không kẽ hở

Đầu năm 2025, một nhóm doanh nhân giàu có ở Italy bất ngờ nhận được cuộc gọi từ “Bộ trưởng Quốc phòng Guido Crosetto”. Người ở đầu dây với giọng nói giống hệt vị quan chức này và khẩn khoản kêu gọi họ đóng góp tiền để giải cứu các nhà báo Italy ở Trung Đông.
Tuy nhiên, ông Crosetto thật hoàn toàn không hay biết. Ông chỉ phát hiện sự việc khi một số doanh nhân liên hệ xác minh. Cảnh sát sau đó kết luận đây là vụ lừa đảo tinh vi. Những kẻ đứng sau đã dùng trí tuệ nhân tạo (AI) để giả giọng nói của bộ trưởng, đánh lừa nạn nhân chuyển tiền vào tài khoản ở nước ngoài.
Vụ việc một lần nữa cho thấy công nghệ AI, dù mang đến nhiều tiện ích, cũng đang mở ra kỷ nguyên mới cho các chiêu thức lừa đảo tinh vi, nơi ranh giới giữa thật và giả ngày càng khó phân biệt.
Công nghệ tạo giọng nói bằng AI dựa trên các thuật toán “học sâu” (deep learning). Bằng cách phân tích hàng nghìn giờ ghi âm giọng nói của con người, hệ thống học cách bắt chước cao độ, ngữ điệu, nhịp điệu và cách phát âm. Khi đã được huấn luyện đủ dữ liệu, AI có thể tái tạo giọng nói của một người cụ thể hoặc tạo ra giọng nói hoàn toàn mới, có âm sắc và cảm xúc gần như thật.
Công nghệ này kết hợp tính năng xử lý ngôn ngữ tự nhiên (NLP) và tổng hợp giọng nói. NLP giúp AI hiểu ngữ nghĩa và sắc thái cảm xúc trong lời nói trong khi bộ tổng hợp giọng nói chuyển văn bản thành âm thanh. Kết quả cho ra là một bản sao giọng nói do AI tạo ra (AI voice clone) nghe rất giống người thật, đến mức khó phân biệt bằng tai thường.
Theo bà Nadine Lavan, giảng viên Tâm lý học tại Đại học Queen Mary London (Anh), các mô hình AI có thể được huấn luyện bằng hàng nghìn giờ dữ liệu để “học” giọng nói của con người nói chung hoặc tái hiện giọng của một cá nhân cụ thể.
“Bạn chỉ cần đưa cho mô hình một ví dụ về giọng nói và yêu cầu nó sao chép. Nó có thể tạo ra một phiên bản deepfake gần như không thể nhận ra”, bà nói và cho hay, từ đó khái niệm “deepfake” ra đời.
Thuật ngữ trên ghép từ “deep learning” (học sâu) và “fake” (giả) được chuyên gia người Mỹ Ian Goodfellow đặt ra năm 2014. Nó đã trở thành biểu tượng cho một kỷ nguyên mới, nơi AI có thể tạo ra hình ảnh, video hay âm thanh có độ chân thực cao, đến mức khiến con người khó lòng phân biệt thật - giả.
Deepfake khiến con người khó phân biệt thật - giả.


Khả năng tinh vi

Một nghiên cứu của Đại học Queen Mary London, công bố trên tạp chí PLOS One ngày 24/9, đã chứng minh rằng giọng nói do AI tạo ra hiện “không thể phân biệt được” với giọng nói thật của con người.
Nhóm nghiên cứu đã tạo 40 mẫu giọng nói bằng công cụ ElevenLabs, bao gồm cả giọng “deepfake” và giọng hoàn toàn mới, đồng thời thu thập thêm 40 mẫu giọng thật. Tất cả được xử lý, làm sạch và thử nghiệm với 50 người tham gia tại Anh, trong độ tuổi từ 18 đến 65.
Kết quả cho thấy, 41% giọng nói do AI tạo ra và 58% giọng nói nhái lại bị nhầm là giọng người thật. Đáng chú ý, người tham gia còn đánh giá giọng nói do AI tạo ra đáng tin cậy hơn giọng thật, kết quả trái ngược với các nghiên cứu trước đây.
Nghiên cứu cũng cho thấy, giọng nói mang âm sắc Anh được xem là “thật” nhiều hơn so với giọng Mỹ, phản ánh khả năng tinh chỉnh cực kỳ chi tiết của công nghệ AI hiện nay.
Bà Lavan nhận định sự tiến bộ này đến từ việc các mô hình AI hiện được huấn luyện bằng dữ liệu chất lượng cao và đa dạng hơn trước rất nhiều. “Nhờ tiếp xúc với lượng thông tin khổng lồ về cách con người nói, AI có thể mô phỏng không chỉ cao độ, ngữ điệu, mà cả những yếu tố rất nhỏ – như tiếng thở, độ ngắt quãng hay lỗi phát âm”, bà nói.
Công nghệ tạo giọng nói bằng AI mở ra nhiều cơ hội mới cho ngành quảng cáo, điện ảnh và hỗ trợ người khuyết tật, nhưng đồng thời cũng tiềm ẩn rủi ro lớn nếu bị lạm dụng. Các vụ lừa đảo dùng giọng “deepfake” đang gia tăng nhanh chóng trên toàn cầu. Những phát hiện trên cho thấy ranh giới giữa giọng nói thật và giọng nói nhân tạo đang mờ dần, đặt ra thách thức lớn về niềm tin và an toàn thông tin trong thời đại deepfake phát triển mạnh mẽ.
Theo Công ty Resemble AI (Mỹ), chỉ trong nửa đầu năm nay, người dân trên thế giới đã mất hơn 547 triệu USD vì lừa đảo deepfake, tăng mạnh so với đầu năm. Khi AI chỉ cần vài giây ghi âm để tái tạo giọng nói, nguy cơ đánh cắp danh tính và gian lận tài chính ngày càng đáng lo.
Dù vậy, theo chuyên gia Nadine Lavan, công nghệ này cũng đang được khai thác cho những mục đích nhân văn như giúp những người mất khả năng nói có thể tìm lại giọng nói của chính mình, hoặc tạo ra một giọng nói mới thể hiện bản sắc cá nhân.
Như nhiều công nghệ khác, AI không tự “tốt” hay “xấu”. Điều quan trọng là cách con người sử dụng nó trong thế giới ngày càng khó phân biệt thật – giả.
Theo Nguyễn Minh (TH)
giaoducthoidai.vn
Theo: giaoducthoidai.vn
2026/03/22 07:24 (GMT+7)
2026-05-13 10:17

Hai giáo sư với hơn 600 công bố quốc tế giảng dạy tại Đại học Quốc gia TPHCM

GD&TĐ - Thêm 2 nhà khoa học hàng đầu thế giới lĩnh vực kỹ thuật và công nghệ thông tin trở thành giáo sư thỉnh giảng tại Đại học Quốc gia TPHCM.

Hai giáo sư với hơn 600 công bố quốc tế giảng dạy tại Đại học Quốc gia TPHCM
2026-05-13 10:17

TPHCM yêu cầu các trường chuẩn bị đầy đủ cho hai kỳ thi quan trọng năm 2026

GD&TĐ - Sở GD&ĐT TPHCM yêu cầu các trường bảo đảm đủ nhân sự, cơ sở vật chất, thực hiện nghiêm quy chế kỳ thi tốt nghiệp THPT và tuyển sinh lớp 10.

TPHCM yêu cầu các trường chuẩn bị đầy đủ cho hai kỳ thi quan trọng năm 2026
2026-05-13 10:17

Liên ngành mở rộng lựa chọn nghề nghiệp

GD&TĐ - Xu hướng đào tạo liên ngành, xuyên ngành được nhiều trường đại học đẩy mạnh nhằm giúp sinh viên thích ứng linh hoạt với thị trường lao động.

Liên ngành mở rộng lựa chọn nghề nghiệp
2026-05-13 10:17

Trang bị kỹ năng an toàn cho học sinh trong phòng chống đuối nước

GD&TĐ - Nhiều trường học tại Phú Thọ tăng cường tổ chức hoạt động ngoại khóa về phòng chống đuối nước, tai nạn thương tích cho học sinh.

Trang bị kỹ năng an toàn cho học sinh trong phòng chống đuối nước
2026-05-13 10:16

Thúc đẩy đối ngoại truyền thông và giáo dục ngôn ngữ trong đại học

GD&TĐ - Hội thảo quốc tế với chủ đề Đối ngoại - Truyền thông - Giáo dục ngôn ngữ trong kỷ nguyên hội nhập có 20 trường ĐH, viện nghiên cứu tham gia.

Thúc đẩy đối ngoại truyền thông và giáo dục ngôn ngữ trong đại học
2026-05-13 10:16

Startup AI Việt: Đừng để mình là 'lớp áo mỏng' trên nền công nghệ mượn

GD&TĐ - Trong cơn sốt AI, câu hỏi dành cho các startup Việt không còn là "có làm được AI không", mà là làm sao để không bị "khai tử" chỉ sau một đêm.

Startup AI Việt: Đừng để mình là 'lớp áo mỏng' trên nền công nghệ mượn
2026-05-13 10:15

Bí quyết ôn thi môn Toán kỳ thi tốt nghiệp THPT 2026

GD&TĐ - Đề thi Toán theo Chương trình GDPT 2018 đòi hỏi thí sinh thay đổi cách học, vận dụng thực tiễn và kỹ năng xử lý thông tin hiệu quả.

Bí quyết ôn thi môn Toán kỳ thi tốt nghiệp THPT 2026
2026-05-13 10:15

Mỗi năm 35.000 ca tai biến thẩm mỹ: Hậu quả tử ‘ma trận’ làm đẹp

GD&TĐ - Thị trường làm đẹp bùng nổ kéo theo hệ lụy kinh hoàng khi hàng nghìn ca tai biến mỗi năm đang đẩy gánh nặng lên vai các bác sĩ.

Mỗi năm 35.000 ca tai biến thẩm mỹ: Hậu quả tử ‘ma trận’ làm đẹp
2026-05-13 10:15

Trốn trong bụi cây, học sinh lớp 4 bị ong vò vẽ đốt nguy kịch

GD&TĐ - Trốn trong bụi cây, T.S.Th không may bị ong vò vẽ đốt hơn 70 vết, nhập viện cấp cứu trong tình trạng nguy kịch.

Trốn trong bụi cây, học sinh lớp 4 bị ong vò vẽ đốt nguy kịch
2026-05-13 10:15

Hàng chục nghìn khán giả Mexico bùng nổ trong đêm diễn của BTS

GD&TĐ - Theo tờ Los Angeles Times, hơn 1 triệu người được cho là đã cố gắng mua vé, cho thấy tầm ảnh hưởng phi thường của BTS.

Hàng chục nghìn khán giả Mexico bùng nổ trong đêm diễn của BTS