Tương tự như con người, máy móc hiện nay đã có thể tự xếp loại hình ảnh dựa trên gu thẩm mỹ riêng của chúng nhờ vào một mô hình trí tuệ nhân tạo (AI) mới được tạo ra bởi các nhà nghiên cứu tại Google.

Neural Image Assessment (NIMA) được thiết kế bằng thuật toán “machine learning” và thường được biết đến với tên gọi Convolutional Neural Network (CNN – mạng thần kinh xoắn), sử dụng những dữ liệu được kiểm định và đánh giá bởi con người.

 

(Nguồn Pixabay)

 

Không giống như các mô hình hiện tại thường chỉ có thể phân loại hình ảnh dựa trên chất lượng, NIMA có thể được đào tạo để dự đoán những hình ảnh mà một cá nhân nào đó sẽ đánh giá cao cả về mặt kỹ thuật lẫn thẩm mĩ.

Theo chia sẻ từ các nhà nghiên cứu trên một trang blog công nghệ, NIMA làm được điều này bằng cách nhận dạng và phân loại hình ảnh dựa trên nhiều đặc điểm tính cách con người khi liên kết với cảm xúc và vẻ đẹp, sau đó sẽ cho điểm từ 1 đến 10. Đồng thời, các nhà nghiên cứu cũng khẳng định rằng NIMA phù hợp với việc thu thập dữ liệu đào tạo hơn, và cũng mang lại kết quả dự đoán những lựa chọn của con người chính xác hơn so với các phương pháp khác.

NIMA đã được kiểm tra khả năng bằng cơ sở dữ liệu hình ảnh diện rộng nhằm mục đích đánh giá phân tích thẩm mỹ (Aesthetic Visual Analysis - AVA). Mỗi bức ảnh phân tích bởi AVA được tính điểm bằng cách lấy con điểm trung bình từ 200 người với tiêu chí một cuộc thi nhiếp ảnh.

Sau khi được đào tạo, bảng xếp hạng các bức ảnh do NIMA đánh giá có kết quả gần như ngang bằng so với kết quả đánh giá của con người. (Ví dụ minh họa như hình ảnh dưới đây)

 

(Nguồn Google)

 

Theo Google, điểm số chấm bởi NIMA có thể được sử dụng để so sánh chất lượng  các phiên bản khác nhau của cùng một bức ảnh, đồng thời cũng được sử dụng để nâng cao chất lượng cảm quan về bức ảnh đó nhằm mục đích tìm kiếm khả năng thẩm mỹ gần giống với con người nhất về các yếu tố sáng tối, độ tương phản và đổ bóng.

 

(Nguồn Google)

 

Ngoài ra, các nhà nghiên cứu còn cho rằng NIMA cũng có thể được sử dụng để cải thiện một cách trực tiếp quá trình chụp ảnh cũng như  khâu chỉnh sửa.

 

Công dụng đối với chính phủ

Thú vị thay, NIMA thực tế chỉ là một trong số nhiều công cụ “machine learning” có khả năng gần giống với con người mà Google phát triển.

Một ví dụ điển hình là một bài báo nghiên cứu được công bố bởi một “gã khổng lồ” về công nghệ vào tháng 1 đã mô tả một hệ thống chuyển đổi văn bản thành bài nói với tên gọi Tacotron 2, với khả năng bắt chước và tái hiện lời nói từ văn bản với độ chính xác gần như ngang bằng giọng nói thật của con người.

Hệ thống cũng có thể xử lý các từ và tên khó phát âm, cũng như thay đổi cách thức phát âm dựa trên dấu chấm câu. Ví dụ, các từ viết in hoa sẽ được đọc nhấn mạnh khi chúng ta muốn chỉ ra phần quan trọng trong câu.

 

Nhà vô địch cờ vua

Các nhà nghiên cứu từ phòng thí nghiệm DeepMind AI của Google gần đây cũng đã phát triển AlphaZero, với khả năng học thuộc tất cả kiến ​​thức cờ vua của con người chỉ trong vòng bốn giờ đồng hồ.

Sau khi được lập trình các quy tắc của cờ vua, AlphaZero đã thông thạo trò chơi đến mức có thể đánh bại được chương trình chơi cờ vua được đánh giá cao nhất - Stockfish.

 

 (Nguồn: Cornell University)

 

Theo nhận định của một vài chuyên gia “Công cụ này chắc chắn sẽ tạo nên cuộc cách mạng hóa đối với trò chơi. Tuy nhiên, chúng ta hãy suy nghĩ xa hơn đến việc làm cách nào để có thể ứng dụng được nó cả vào những mục đích khác ngoài cờ vua. Thuật toán này trong tương lai có thể sẽ điều khiển được cả những thành phố, lục địa và thậm chí là vũ trụ. "

TỔNG HỢP BỞI TRÒN HOUSE