Bất cứ ai đã dùng thử Google Photos đều đồng ý rằng dịch vụ quản lý và lưu trữ ảnh miễn phí này từ Google là thông minh. Nó tích hợp nhiều tính năng thông minh khác nhau như tìm kiếm nâng cao, khả năng phân loại hình ảnh của bạn theo địa điểm và ngày, tự động tạo album và video dựa trên sự tương đồng và đưa bạn xuống làn đường bộ nhớ bằng cách hiển thị cho bạn những bức ảnh cùng ngày cách đây vài năm. Có rất nhiều điều Google Photos có thể làm mà vài năm trước đây là điều không thể. Google Photos là một trong nhiều dịch vụ thông minh trên mạng của Google sử dụng công nghệ máy học có tên là TensorFlow. Việc học từ chỉ ra rằng công nghệ sẽ trở nên thông minh hơn theo thời gian đến mức mà kiến thức hiện tại của chúng ta không thể tưởng tượng được. Nhưng TensorFlow là gì? Làm thế nào một máy có thể học? bạn có thể làm gì với nó? Hãy cùng tìm hiểu.
TensorFlow là gì?
TensorFlow là phần mềm trí tuệ nhân tạo mạnh mẽ và mã nguồn mở của Google, cung cấp nhiều dịch vụ và sáng kiến từ Google. Đây là thế hệ thứ hai của một hệ thống dành cho việc triển khai máy học quy mô lớn, được xây dựng bởi nhóm Google Brain. Thư viện thuật toán này thành công DistBelief - thế hệ đầu tiên.
Công nghệ đại diện cho tính toán dưới dạng biểu đồ luồng dữ liệu trạng thái. Điều làm nên sự độc đáo của TensorFlow là khả năng mô hình hóa các tính toán trên một loạt phần cứng, từ các thiết bị di động cấp tiêu dùng đến các máy chủ đa GPU đẳng cấp thế giới. Nó có thể chạy trên các GPU và CPU khác nhau và hứa hẹn khả năng mở rộng của máy học giữa các thiết bị và tiện ích khác nhau mà không phải thay đổi một lượng mã đáng kể.
TensorFlow có nguồn gốc từ nhu cầu của Google để hướng dẫn một hệ thống máy tính bắt chước cách thức bộ não của con người hoạt động trong học tập và lý luận. Hệ thống, được gọi là mạng nơ-ron, có thể thực hiện trên các mảng dữ liệu đa chiều được gọi là tenxơ. Mục tiêu cuối cùng là đào tạo các mạng thần kinh để phát hiện và giải mã các mô hình và mối tương quan.
Vào tháng 11 năm 2015, Google đã biến công nghệ này thành nguồn mở và cho phép nó được áp dụng vào tất cả các loại sản phẩm và nghiên cứu. Bất kỳ ai, bao gồm các nhà nghiên cứu, kỹ sư và người có sở thích, có thể giúp tăng tốc độ phát triển của máy học và đưa nó lên một cấp độ cao hơn trong thời gian ngắn hơn.
Động thái này hóa ra là đúng đắn vì có rất nhiều đóng góp từ các nhà phát triển độc lập cho TensorFlow đến mức họ vượt xa các đóng góp của Google. Wikipedia đề cập rằng, có 1500 kho lưu trữ trên GitHub, trong đó đề cập đến TensorFlow, trong đó có 5 kho lưu trữ từ Google. Một trong những cuộc thảo luận tại Quora nghi ngờ rằng mã nguồn mở được phát hành là phiên bản đã được dọn sạch một cái mà Google sử dụng trong các dịch vụ của mình.
TenserFlow hoạt động như thế nào?
Sử dụng ngôn ngữ bình thường đơn giản của con người và đơn giản hóa nặng nề, chúng ta có thể thấy một mặt của TensorFlow là một công nghệ lọc tự trị tiên tiến. Tại trung tâm của nó, công nghệ là một thư viện phần mềm khổng lồ của máy học. Nó sử dụng cơ sở dữ liệu để giúp nó đưa ra quyết định.
Ví dụ: ai đó tải ảnh lên Google Photos. Công nghệ sẽ so sánh tất cả các chi tiết từ hình ảnh với cơ sở dữ liệu của nó và quyết định xem đó là hình ảnh của động vật hay con người. Sau đó, nếu đó là một con người, nó sẽ cố gắng xác định giới tính, độ tuổi cho đến tất cả con người. Quá trình tương tự được lặp lại cho các đối tượng khác trong ảnh.
Nó cũng sử dụng dữ liệu của người dùng như danh tính của người trong ảnh và vị trí chụp ảnh, để nâng cao thư viện của mình để có thể mang lại kết quả tốt hơn trong tương lai - cho cả cá nhân đã tải ảnh lên và cho mọi người khác Do đó, thuật ngữ học tập học trực tuyến. Nhưng nó không chỉ dừng lại ở việc biết và học dữ liệu từ ảnh. Có rất nhiều công nghệ có thể làm với thông tin từ một bức ảnh. Chẳng hạn, nó có thể nhóm các bức ảnh với các chi tiết tương tự như cùng một người, cùng một địa điểm, cùng một ngày; xem mô hình khuôn mặt để xác định gia đình và bạn bè người trong ảnh thuộc về ai, và sử dụng thông tin để tạo video về kỳ nghỉ gia đình hoặc hoạt hình từ những bức ảnh liên tục.
Điều đó hầu như không làm trầy xước bề mặt của hoạt động của TensorFlow, nhưng tôi hy vọng nó có thể cung cấp cho bạn một bức tranh chung về công nghệ. Ngoài ra, chỉ sử dụng một ví dụ không thể thực hiện công bằng với khả năng của nó.
Và đối với tất cả những người đam mê Trí tuệ nhân tạo ngoài kia, điều đáng nói là Google đã tạo ra một công nghệ chip máy tính được tối ưu hóa cho việc học máy và tích hợp TensorFlow vào nó. Nó được gọi là chip ASIC Đơn vị xử lý (TPU) .
Những ai muốn tìm hiểu thêm về TensorFlow có thể truy cập trang hướng dẫn của nó.
Các ứng dụng của TensorFlow
Chúng ta đang ở giai đoạn đầu của công nghệ máy học, vì vậy không ai biết nó sẽ đưa chúng ta đi đâu. Nhưng có một vài ứng dụng ban đầu có thể cho chúng ta nhìn vào tương lai. Vì nó có nguồn gốc từ Google, rõ ràng Google sử dụng công nghệ cho nhiều dịch vụ của mình.
Thêm về phân tích hình ảnh
Chúng tôi đã thảo luận về ví dụ sử dụng công nghệ để phân tích hình ảnh trong Google Photos. Nhưng ứng dụng phân tích hình ảnh cũng được sử dụng trong tính năng Chế độ xem phố của Google Maps. Ví dụ, TensorFlow được sử dụng để kết nối hình ảnh với tọa độ bản đồ và tự động làm mờ số biển số xe của bất kỳ chiếc xe nào vô tình có trong hình ảnh.
Nhận dạng giọng nói
Google cũng đang sử dụng TensorFlow cho phần mềm nhận dạng giọng nói trợ lý giọng nói. Công nghệ cho phép người dùng nói ra các hướng dẫn không phải là mới, nhưng bao gồm cả thư viện phát triển chưa từng có của TensorFlow vào hỗn hợp có thể mang lại cho tính năng này một vài bước. Hiện tại, công nghệ nhận dạng giọng nói nhận ra hơn 80 ngôn ngữ và biến thể.
Dịch động
Một ví dụ khác về phần học tập của các công nghệ máy học là một tính năng dịch thuật của Google. Google cho phép người dùng thêm từ vựng mới và sửa các lỗi trong Google Dịch. Dữ liệu ngày càng tăng có thể được sử dụng để tự động phát hiện ngôn ngữ nhập mà người dùng khác muốn dịch. Nếu máy mắc lỗi trong quá trình phát hiện ngôn ngữ, người dùng có thể sửa chúng. Và máy sẽ học hỏi từ những sai lầm đó để cải thiện hiệu suất trong tương lai. Và chu kỳ tiếp tục.
Alpha đi
Một ví dụ thú vị về việc sử dụng TensorFlow là Alpha Go. Nó là một ứng dụng được lập trình để chơi Go . Đối với những người không quen thuộc với Go, đây là một trò chơi bảng trừu tượng dành cho hai người chơi có nguồn gốc từ Trung Quốc hơn năm nghìn năm trăm năm trước và đây là trò chơi cờ lâu đời nhất vẫn được chơi liên tục cho đến ngày nay. Mặc dù các quy tắc rất đơn giản - bao quanh nhiều lãnh thổ hơn đối thủ, nhưng trò chơi lại phức tạp đến không ngờ và theo Wikipedia: Chiếm hữu nhiều khả năng hơn tổng số nguyên tử trong vũ trụ hữu hình.
Vì vậy, thật thú vị khi công nghệ máy học có thể làm được với những khả năng vô hạn. Trong các trận đấu với Lee Sedol - nhà vô địch thế giới cờ vây 18 lần, Alpha Go đã thắng 4 trên 5 trận và được trao danh hiệu cao quý nhất danh hiệu Go.
Dự án Magenta
Một ứng dụng thú vị khác của TensorFlow là Dự án Magenta. Đó là một dự án đầy tham vọng để tạo ra nghệ thuật tạo ra máy móc . Một trong những kết quả hữu hình ban đầu của thí nghiệm là giai điệu piano 90 giây. Về lâu dài, Google hy vọng sẽ tạo ra nghệ thuật tạo ra máy móc tiên tiến hơn thông qua dự án Magenta của mình và xây dựng một cộng đồng nghệ sĩ xung quanh nó.
Vào tháng 2 năm 2016, Google cũng đã tổ chức một cuộc triển lãm nghệ thuật và đấu giá tại San Fransisco trưng bày 29 máy tính được tạo ra - với một chút trợ giúp từ những tác phẩm nghệ thuật của con người. Sáu trong số các tác phẩm lớn nhất đã được bán với giá lên tới 8.000 đô la. Máy tính có thể vẫn còn một chặng đường rất dài trước khi nó có thể bắt chước một nghệ sĩ thực thụ, nhưng số tiền mọi người sẵn sàng trả cho nghệ thuật cho chúng ta thấy công nghệ đã đi được bao xa.
Hỗ trợ cho iOS
Mặc dù chúng ta đã thấy các khả năng của TenserFlow trên Android, nhưng với phiên bản mới nhất của nó, cuối cùng thì TensorFlow cũng hỗ trợ thêm cho các thiết bị iOS. Vì có hàng tấn ứng dụng di động tuyệt vời dành riêng cho iOS hoặc được phát hành đầu tiên trên iOS, điều đó có nghĩa là chúng ta có thể mong đợi nhiều ứng dụng di động tuyệt vời hơn sẽ áp dụng học máy trong tương lai gần. Điều tương tự cũng có thể nói đối với khả năng áp dụng và ứng dụng rộng rãi hơn của TensorFlow.
Tương lai của TensorFlow
Người ta có thể làm gì với một cỗ máy có khả năng học hỏi và tự đưa ra quyết định? Là một người liên quan đến nhiều ngôn ngữ như một phần của cuộc sống hàng ngày, điều đầu tiên xuất hiện trong tâm trí tôi là dịch ngôn ngữ. Không phải trong từng từ theo cấp độ từ, mà nhiều hơn ở cấp độ văn bản dài hơn như tài liệu hoặc thậm chí sách. Công nghệ dịch thuật ngày nay chỉ giới hạn trong các từ vựng. Bạn có thể dễ dàng tìm hiểu thế nào là người ngủ ngủ trong tiếng Trung và ngược lại, nhưng hãy thử viết một chương của Musashi của Eiji Yoshikawa bằng tiếng Nhật gốc và dịch chương này sang tiếng Anh. Bạn sẽ thấy những gì tôi đang nhận được.
Thật thú vị khi thấy tương lai của Trí tuệ nhân tạo có thể làm gì với âm nhạc. Mặc dù vẫn còn rất cơ bản, ứng dụng Music Mem của Apple đã có thể cung cấp âm trầm và trống tự động cho bài hát được ghi của bạn. Tôi nhớ một tập của chương trình truyền hình SciFi trong đó một nhân vật trong chương trình đã tạo ra một cỗ máy phân tích tất cả các bài hát hàng đầu trong bảng xếp hạng và có thể viết các bài hát hit của riêng mình. Chúng ta sẽ đến đó chứ?
Và như ý nghĩ kết thúc, tôi muốn đề cập đến Sunspring . Đây là một bộ phim khoa học viễn tưởng ngắn được viết hoàn toàn bởi một nhà biên kịch AI, người tự gọi mình là Benjamin - người thậm chí còn sáng tác các đoạn nhạc pop-song. Bộ phim đã được đạo diễn Oscar Sharp kết hợp cho sự kiện Film Challenge of Sci-Fi London kéo dài 48 giờ.
Bây giờ tôi không thể ngừng suy nghĩ về Kẻ hủy diệt. Chào mừng đến với tương lai.
Tín dụng hình ảnh: Wikipedia, TechInsider, The Verge, Wall Street Journal