ĐIỀU QUAN TRỌNG KHI NÓI VỀ KHẢ NĂNG ‘NHÌN THẤY’ HÌNH ẢNH CỦA BỘ NÃO

Cách bộ não của chúng ta diễn tả thế giới nắm giữ chìa khóa để chúng ta có thể cải thiện những hình ảnh mà chúng ta tạo ra bằng các thiết bị điện tử của mình.

Bên ngoài bộ não của chúng ta, dễ dàng để theo dõi đường đi của một hình ảnh đến đôi mắt. Thông thường, có một ống kính, một cảm biến, một số xử lý, một tệp tin (Hoặc một output thời gian thực), một trình phát, và một màn hình.

Và, chuyện là như vậy. Tất cả mọi thứ đều ở đó nếu bạn muốn phân tích nó. Không cần phải suy đoán về bất kỳ phần nào, vì chúng ta có thể đi vào nó, tách bạch nó ra, và thấy – và chứng minh – điều gì đang xảy ra.

Nhưng điều gì xảy ra tiếp theo? Đây là nơi phần lớn chúng ta còn đang thấy hơi mù mờ.

Chúng ta đã hiểu khá rõ về đôi mắt. Vậy nên chúng ta sẽ không nói thêm gì ở đây. Chúng ta biết rằng hình ảnh được truyền từ đôi mắt đến não bộ thông qua một hệ thống thần kinh thị giác. Về cơ bản thì nó là một hệ thống quang học và điện từ.

Nhưng sau đó, điều gì xảy ra?

Cả đống thứ.

Một số nhà thân kinh học cho rằng có ít nhất 12 cơ chế riêng biệt liên quan đến khả năng phân tích một hình ảnh, bao gồm nhận diện các đối tượng. Có rất nhiều loại đường dẫn tham dự quá trình này. Tân vỏ não (Neocortex) là một phần trong quá trình này, với cấu trúc phân cấp, nó tìm các mẫu đơn giản đầu tiên và liên kết chúng lại với nhau để hình thành một cấu trúc phức tạp hơn. Nó giống như việc kết hợp hai nét gạch dọc với một nét gạch ngang để thành ký tự ‘H’, rồi sau đó kết hợp các ký tự đơn lẻ thành một chữ ‘Heo” và kết hợp các chữ thành một câu ‘Những con Heo ở trang trại”, bằng cách kết hợp các yếu tố liền kề có thể nhận biết được theo cả chiều dọc lẫn chiều ngang giữa các mức phân cấp và , bên cạnh các khái niệm liền kề.

Thế nhưng đây chưa phải là giai đoạn cuối cùng

Vậy thì, giai đoạn cuối cùng là gì? Hay phần cuối cùng của quá trình nhận thức hình ảnh này là gì?

Khi bạn nhận thức điều gì đó, nó gần như là bạn đang vượt qua một số loại ranh giới. Ranh giới giữa thế giới bên ngoài và – chính xác thì là gì?

Câu trả lời là sự nhận biết. Nó là điểm mà tại đó, điều gì đó đi vào ý thức của bạn.

Đối với các triết gia và các nhà thần kinh học, việc đưa ý thức vào cuộc trò chuyện sẽ mở ra. Sẽ rất dễ nhận ra rằng, chúng ta biết quá ít về nó.

Chúng ta là hệ quả của ý thức của mình

Việc này có vẻ khó tin. Nhưng rốt cuộc, chúng ta sống trong ý thức của mình. Chúng ta là hệ quả của ý thức của mình. Ý thức của chúng ta và bản ngã của chúng ta (bất cứ thứ gì mà bạn có thể nói về ‘cái tôi’ của bạn) là tất cả những gì chúng ta biết, và tất cả những gì chúng ta có khi khi so sánh chúng ta với thế giới và những người khác. Khi bạn sống cả đời trong một cái lều, rất khó để biết được điều gì đang diễn ra ở ngoài kia.

Nhưng chúng ta đều muốn biết điều gì đang diễn ra bên ngoài. Chúng ta làm điều này chủ yếu thông qua quá trình nhận thức (tôi nói ‘chủ yếu’ là vì đôi khi một số kiến thức của chúng ta biết thông qua các định nghĩa của người khác và quá trình tự-chứng-minh).

Điểm mà tại đó chúng ta bắt đầu biết điều gì đang diễn ra bên ngoài được gọi là sự nhận thức. Nó là ngưỡng giới hạn chia cách thế giới với các quá trình diễn ra trong bộ não của chúng ta và ý thức của chúng ta.

Đây là một vấn đề khá dài dòng chứ không chỉ đơn thuần là độ phân giải của hình ảnh. Có lẽ chúng ta nên nhìn xa hơn khía cạnh duy nhất về bản chất của hình ảnh mà chúng ta ghi lại, hướng tới cách để tối ưu hóa hình ảnh cho quá trình chuyển đổi nhận thức vào ý thức của chúng ta.

Mọi thứ trở nên trừu tượng, vậy nên để khiến nó dễ hiểu hơn, hãy so sánh giữa cách đôi mắt và bộ não của chúng ta diễn giải hình ảnh với cách chúng ta viết các chương trình được tối ưu hóa cho card đồ họa (GPU)

Không phải GPU nào cũng giống nhau. Nếu như vậy, chúng sẽ không thể nào cải tiến được nữa. Vậy nên ngôi ngữ đã được phát triển để các nhà phát triển viết ra các chỉ dẫn dựa trên một tập hợp các lệnh và thói quen trừu tượng. Để đơn giản hóa mọi thứ nhất có thể, để vẽ một vòng tròn, thay vì ra lệnh cho GPU chiếu sáng một tập hợp các điểm ảnh mà chúng ta chỉ định điểm ảnh theo điểm ảnh, điều đó xảy ra trong một vòng tròn, chúng ta sẽ dùng ngôn ngữ cấp độ cao hơn này để nói ‘Vẽ một vòng tròn màu đen, với chiều ngang thế này, đường kính thế này, tâm ở kia.” Sau đó GPU sẽ ‘kết xuất’ vòng tròn này dựa trên các đặc tính của màn hình mà nó biết. Các chỉ dẫn tương tự tồn tại cho nhiều ‘gốc’ khác nhau, và điều này đảm bảo rằng các chương trình được viết cho GPU có thể tương thích với nhiều phần cứng khác nhau, chỉ cần ‘ngôn ngữ’ này được chia sẻ bởi chúng và ‘được hiểu’ đủ để đưa ra các diễn giải chính xác cho các hướng dẫn.

Bạn các tối ưu hóa và hệ thống lại các hướng dẫn cho ngôn ngữ cụ thể được sử dụng bởi GPU của bạn, thì nó sẽ càng hoạt động nhanh hơn và hiệu quả hơn.

(Open CL là một trong những ví dụ về ‘ngôn ngữ’ mà chúng ta nhắc đến ở trên. CUDA, được Nvidia sử dụng, là một ví dụ khác).

Những ngôn ngữ này được chia thành các phần được gọi là ‘Gốc Đồ họa’ (Graphics Primitives). Chúng là những thành phần cơ bản nhất tạo ra một hình ảnh, như cái vòng tròn được mô tả ở trên.

Tôi có linh cảm rằng nhận thức của chúng ta cũng hoạt động theo cách tương tự: Một bộ các gốc đồ họa được sử dụng như các đơn vị xây dựng cơ bản của các hình ảnh tinh thần. Nó là một hệ thống thứ bậc của các hoạt động xây dựng theo chiều dọc để tạo ra một hình ảnh có độ phức tạp bất kỳ.

Tôi tin rằng chúng ta nên nghiên cứu lĩnh vực về các hoạt động tinh thần này. Chỉ khi chúng ta bắt đầu hiểu rằng chúng ta sẽ có thể vượt ra ngoài các điểm ảnh – và có lẽ vượt ra ngoài phạm trù màn hình.

Làm ơn đừng nghĩ rằng tôi nói như vậy thì trong tương lai chúng ta không cần ghi lại hình ảnh ở độ phân giải cao nữa, tôi không có ý đó. Nếu độ phân giải của máy quay không đủ để ghi lại các chi tiết mà chúng ta muốn thấy, thì chúng ta cần độ phân giải cao hơn.

Nhưng một khi chúng ta đã có được các hình ảnh đó, chúng ta cần tìm một cách tốt hơn để chuyển các thông tin đó qua hệ thống thần kinh của não bộ và đưa nó đến ngưỡng nhận thức của chúng ta.

Chúng ta cần phải hiểu biết nhiều hơn về nhận thức và ý thức của chúng ta để có thể làm được điều này. Và chúng ta chắc chắn cần phải tăng công suất xử lý lên hàng ngàn lần.

Nhưng có thể mất hàng ngàn năm

(Tôi ước tính rằng iPhone hiện tại mạnh hơn iPhone cũ một ngàn lần, chỉ trong vòng 11 năm. Với sự trợ giúp của AI, các card đồ họa có thể thực hiện những bước nhảy vọt trong việc cải thiện hiệu suất để xử lý real time)

Nguồn: RedShark News

Pixel Factory sưu tầm và biên dịch

Tin liên quan