
Giám đốc điều hành Midjourney, David Holz, tuần trước đã công khai thuyết minh mảng kinh doanh hình ảnh y tế của công ty: người dùng bước vào bồn ngâm, ngâm 60 giây, với 40 mô-đun để quét siêu âm toàn thân; công ty tuyên bố chất lượng hình ảnh “mạnh tương đương MRI”. Năm giáo sư chẩn đoán hình ảnh và tim mạch đến từ Đại học Michigan, Washington, Wisconsin và Jefferson đã đưa ra nhận xét gần như nhất quán về các tuyên bố kỹ thuật: “cường điệu quá mức” và “hoàn toàn không có cơ sở”.
Midjourney rót 74 triệu USD, ký thỏa thuận hợp tác với Butterfly Network
Midjourney đã đầu tư 74 triệu USD và vào tháng 11/2025 đã ký thỏa thuận hợp tác với công ty chip siêu âm Butterfly Network. Kế hoạch mở rộng mà công ty công bố là: năm 2027 mở cơ sở thủy liệu đầu tiên tại San Francisco; đến 2031 triển khai 50.000 máy quét, năng lực quét đạt 1 tỷ lượt/tháng. Máy quét thế hệ thứ ba dự kiến ra mắt vào năm 2028, công ty cho biết khi đó chất lượng hình ảnh và tốc độ sẽ có “khác biệt một trời một vực”.
Công ty trong blog chính thức trích dẫn thống kê rằng “nếu có sàng lọc hình ảnh sớm đủ sớm, toàn cầu có thể tránh được 30% số ca tử vong và 50% chi phí y tế”. Giáo sư tim mạch dự phòng Venkatesh Murthy của Đại học Michigan trong một cuộc phỏng vấn cho biết thông điệp truyền thông ra bên ngoài của công ty chủ yếu liên quan đến sàng lọc ung thư và kéo dài tuổi thọ, chứ không phải đo thành phần cơ thể như công ty tuyên bố—mà theo ông thì “độ chính xác cũng tương đương với một vài loại cân”.
Năm giáo sư chẩn đoán hình ảnh nêu ra 3 giới hạn vật lý lớn của siêu âm: xương, khoang chứa không khí và suy giảm do mỡ
Giáo sư chẩn đoán hình ảnh tại Đại học Wisconsin Scott Reeder cho biết công nghệ siêu âm hiện nay thường cần hơn 30 phút để hoàn tất quét một vùng nhất định; để đạt hiệu quả “tương đương” MRI hoặc CT là “một bước nhảy lớn”, trong khi hiện tại “vẫn chưa phải công nghệ trưởng thành”. Năm giáo sư cho biết 3 giới hạn vật lý lớn của siêu âm:
Xương và khoang chứa không khí: sóng âm bị phản xạ trực tiếp tại ranh giới giữa xương và không khí, không thể đi tới mô phía sau; lồng ngực, khoang bụng và khoang sọ đều là vùng “mù” của siêu âm.
Suy giảm do mỡ: mô mỡ làm suy giảm nhanh tín hiệu siêu âm, khiến người dùng có thể trạng lớn hơn giảm rõ rệt chất lượng hình ảnh; các đối tượng trong phần trình diễn hình ảnh hiện có của Midjourney đều là người gầy.
Giới hạn thao tác với nước: cần nước hoàn toàn sạch, không có bọt khí; phải có thiết bị khử khí chuyên dụng; sau khi mỗi khách sử dụng phải thay nước; người dùng cũng cần cạo lông trước.
Giáo sư Murthy của Đại học Michigan cho biết độ phân giải mà công ty nêu ra “rõ ràng là mang tính lý thuyết”, cáo buộc tương đương MRI “hoàn toàn không có cơ sở”, và hình ảnh trình diễn “thiếu độ phân giải rõ ràng”.
Morrison gọi đây là “vibe-based rollout”
Giáo sư chẩn đoán hình ảnh tại Đại học Thomas Jefferson William Morrison gán sự việc này là “vibe-based rollout” (triển khai theo cảm hứng)—một chiến lược phát hành dựa vào cảm xúc và kỳ vọng hơn là dữ liệu kỹ thuật. Ông cho biết phương pháp ngâm nước trong bồn ở giới hình ảnh y tế hiện đại “gần như đã bị bỏ”, hình ảnh hiện có “thua xa CT và MRI hiện hành”, và nói: “Có lẽ đây nhiều hơn là lừa đảo hơn là chuyển đổi.”
Giáo sư chẩn đoán hình ảnh tại Đại học Michigan Matthew Davenport cho rằng các tuyên bố của công ty là “một trong những tuyên bố cường điệu nhất” mà ông từng thấy, đồng thời đưa ra phê bình về đạo đức: “Tung ra trước những tuyên bố chưa được kiểm chứng, gần như chắc chắn không thể đạt được, là vấn đề về mặt đạo đức.” Ông cùng Reeder trong năm nay đã đồng công bố một bài viết trên “Journal of the American Medical Association” (JAMA), nêu rằng sàng lọc hình ảnh quy mô lớn không tự động đồng nghĩa với quyết định điều trị y tế tốt hơn. Reeder cũng nói thêm rằng nếu vì việc này mà ai đó bỏ việc chụp nhũ ảnh hoặc nội soi đại tràng, “điều đó sẽ rất đáng lo”.
Câu hỏi thường gặp
Vì sao thiết bị quét siêu âm của Midjourney không thể thay thế MRI?
MRI sử dụng từ trường mạnh và sóng vô tuyến, có thể xuyên qua xương và tạo hình ảnh độ phân giải cao của các khoang chứa không khí. Siêu âm dựa vào sóng âm; khi gặp ranh giới giữa xương và không khí thì bị phản xạ trực tiếp, lồng ngực, khoang bụng và khoang sọ không thể tạo ảnh—đây là giới hạn căn bản ở mức định luật vật lý. Giáo sư Reeder cho biết thông thường siêu âm hiện có cần hơn 30 phút để hoàn tất quét một vùng, đạt tới mức MRI “là một bước nhảy lớn”.
Vì sao Midjourney định vị thiết bị như một sản phẩm “wellness” thay vì thiết bị y tế?
Trưởng bộ phận phụ trách mảng y tế của Midjourney Tom Calloway đã trao đổi với FDA và đạt được cách phân loại này; “sản phẩm wellness” không chịu các yêu cầu nghiêm ngặt như với thiết bị y tế. Nhưng cách phân loại này đồng thời đồng nghĩa thiết bị không thể tuyên bố hiệu quả sàng lọc ung thư hay kéo dài tuổi thọ dự kiến, và kết quả mà người dùng nhận được từ các buổi quét phải trả tiền cũng không có giá trị chẩn đoán. Các giáo sư cho rằng nội dung truyền thông bên ngoài của công ty có sự chênh lệch đáng kể so với cách phân loại này.
Các căn cứ kỹ thuật mà năm giáo sư nêu phê bình tập trung chủ yếu vào những điểm nào?
Các phê bình tập trung vào ba điểm: độ phân giải của hình ảnh trình diễn thấp rõ rệt so với tiêu chuẩn mà công ty tuyên bố; vùng “mù” vật lý của siêu âm đối với xương và khoang chứa không khí là kết luận khoa học đã có; và trong khi công ty sử dụng “phân loại wellness” để né giám sát, thì truyền thông lại đề cập sàng lọc ung thư và kéo dài tuổi thọ. Davenport và Reeder đã đăng bài trên “Journal of the American Medical Association” (JAMA) nêu vấn đề lợi ích và bất lợi của sàng lọc hình ảnh quy mô lớn.