თანამედროვე სამყაროში ხელოვნური ინტელექტი ყველაზე პოპულარული თემაა. ჩვენ მას ვხვდებით ყველგან. ის არის სმარტფონებში, სოციალურ ქსელებსა და ბანკებში. AI აქტიურად გამოიყენება მედიცინაშიც.
მიუხედავად ამისა, ბევრისთვის ის მაინც „შავ ყუთად“ რჩება. ხალხი ფიქრობს, რომ ეს არის მაგია. ზოგს ჰგონია, რომ კომპიუტერში გონიერი არსება ცხოვრობს. რეალობა კი უფრო პრაგმატულია. ხელოვნური ინტელექტი არ არის ჯადოქრობა. ეს არის მათემატიკისა და სტატისტიკის რთული ნაზავი.
ამ ბლოგში ჩვენ დეტალურად ავხსნით პროცესს. თქვენ გაიგებთ, რა ხდება მანქანის „ტვინში“. ჩვენ ნაბიჯ-ნაბიჯ განვიხილავთ, თუ როგორ სწავლობს სისტემა სამყაროს აღქმას.
მონაცემები: ხელოვნური ინტელექტის საწვავი
სანამ ალგორითმებზე ვისაუბრებთ, უნდა გავიგოთ საფუძვლები. AI-ს მუშაობა იწყება მონაცემებით. მონაცემები AI-სთვის იგივეა, რაც საკვები ადამიანისთვის. ეს არის საწვავი, რომლის გარეშეც მანქანა ვერ იმუშავებს.
მონაცემი შეიძლება იყოს ნებისმიერი რამ. მაგალითად: ტექსტები, ფოტოები, ვიდეოები ან აუდიოჩანაწერები. თუმცა, მანქანა ინფორმაციას ჩვენნაირად ვერ აღიქვამს. კომპიუტერისთვის ფოტო არ არის სურათი. მისთვის ეს მხოლოდ პიქსელების ციფრული მატრიცაა.
ტექსტიც არ არის უბრალოდ სიტყვები. მანქანისთვის ეს რიცხვითი კოდებია. ამიტომ, პირველი ეტაპი ინფორმაციის ციფრებად გადაქცევაა. მხოლოდ ამის შემდეგ შეუძლია ალგორითმს მუშაობა. რაც უფრო დიდია მონაცემთა ბაზა, მით უფრო „ჭკვიანია“ მოდელი.
მანქანური სწავლება: როგორ სწავლობს პროგრამა
ტრადიციული პროგრამირების დროს ადამიანი წერს ზუსტ კოდს. მაგალითად: „თუ დააჭერ A-ს, მოხდეს B“. ხელოვნური ინტელექტი კი სხვაგვარად მუშაობს. ის იყენებს მეთოდს, რომელსაც მანქანური სწავლება (Machine Learning) ეწოდება.
აქ ჩვენ არ ვწერთ წესებს. ჩვენ მანქანას ვაძლევთ მხოლოდ მიზანს და მონაცემებს. წესებს ის თავად პოულობს. არსებობს სწავლების სამი მთავარი მეთოდი. პირველია „მასწავლებლის ზედამხედველობით სწავლება“. ამ დროს ჩვენ მანქანას ვაჩვენებთ ფოტოს და ვეუბნებით: „ეს არის კატა“.
მეორე მეთოდია „ზედამხედველობის გარეშე სწავლება“. ამ შემთხვევაში მანქანა თავად ეძებს კანონზომიერებებს მონაცემებში. მესამე კი არის „განმტკიცებითი სწავლება“. ეს ჰგავს ძაღლის გაწვრთნას. სწორი პასუხისთვის სისტემა იღებს ჯილდოს (ქულას), ხოლო შეცდომისთვის — სასჯელს.
ნეირონული ქსელები: ტვინის იმიტაცია
ხელოვნური ინტელექტის ყველაზე ძლიერი ნაწილია „ღრმა სწავლება“ (Deep Learning). ის ეფუძნება სტრუქტურას, რომელსაც ნეირონული ქსელი ჰქვია. მეცნიერებმა სცადეს ადამიანის ტვინის კოპირება.
ჩვენს ტვინში მილიარდობით ნეირონია. ისინი ერთმანეთს ინფორმაციას ელექტრონული იმპულსებით გადასცემენ. კომპიუტერში ნეირონები მათემატიკური კვანძების სახითაა წარმოდგენილი. ეს კვანძები ფენებად არის დალაგებული.
არსებობს სამი ტიპის ფენა. პირველია შემავალი ფენა, სადაც ინფორმაცია შედის. მეორეა დამალული ფენები, სადაც ხდება გამოთვლები. მესამე კი გამომავალი ფენაა, სადაც პასუხს ვიღებთ. რაც უფრო მეტია ფენა, მით უფრო რთულ ამოცანებს ხსნის სისტემა.
წონები და კავშირები
ნეირონულ ქსელში მთავარი კომპონენტი არის „წონები“ (Weights). წარმოიდგინეთ, რომ ნეირონებს შორის უხილავი ძაფებია გაბმული. ყველა ძაფი ერთნაირი სისქის არ არის. ზოგიერთი კავშირი უფრო მნიშვნელოვანია.
მაგალითად, მანქანა ცდილობს გამოიცნოს ავტომობილი ფოტოზე. ამ დროს ბორბლების არსებობას მეტი „წონა“ ექნება, ვიდრე ღრუბლებს ფონზე. სწავლის დროს სისტემა ამ წონებს მუდმივად ცვლის. თავიდან წონები შემთხვევითია. დროთა განმავლობაში ისინი იხვეწება.
უკუგავრცელება: სწავლა შეცდომებზე
როგორ ხვდება მანქანა, რომ შეცდა? აქ შემოდის მეთოდი, რომელსაც „უკუგავრცელება“ (Backpropagation) ჰქვია. ეს არის AI-ს სწავლების საფუძველი. წარმოიდგინეთ, რომ მოდელმა კატას ძაღლი უწოდა.
სისტემა ამ პასუხს ადარებს სწორ პასუხს. შემდეგ ის ითვლის შეცდომის სიდიდეს. ამისთვის გამოიყენება „დანაკარგის ფუნქცია“. ამის შემდეგ სისტემა მათემატიკურად ბრუნდება უკან. ის პოულობს, რომელმა ნეირონმა გამოიწვია შეცდომა.
სისტემა ოდნავ ცვლის წონებს. მიზანი ისაა, რომ შემდეგ ჯერზე შეცდომა ნაკლები იყოს. ეს ჰგავს მთიდან ბრმად ჩამოსვლას. თქვენ დგამთ ნაბიჯს და მიუყვებით დახრილობას, სანამ ბარში არ ჩახვალთ.
დიდი ენობრივი მოდელები და ტრანსფორმერები
დღეს პოპულარულია ChatGPT და Gemini. ისინი იყენებენ „ტრანსფორმერის“ არქიტექტურას. ძველი სისტემები ტექსტს სიტყვა-სიტყვა კითხულობდნენ. ეს ხშირად იწვევდა აზრის დაკარგვას. ტრანსფორმერები კი სხვაგვარად მუშაობენ.
მათ აქვთ „ყურადღების მექანიზმი“. ეს საშუალებას აძლევს მოდელს, მთელი წინადადება ერთდროულად დაინახოს. ის ხვდება, რომელი სიტყვებია ერთმანეთთან კავშირში. მაგალითად: „ბანკმა სესხი გასცა“. აქ მოდელი ხვდება, რომ „სესხი“ და „ბანკი“ კავშირშია.
ტექსტის დასამუშავებლად სიტყვები გარდაიქმნება რიცხვებად. მათ ტოკენებს ეძახიან. ეს ტოკენები თავსდება ვექტორულ სივრცეში . იქ მსგავსი მნიშვნელობის სიტყვები ერთმანეთთან ახლოს დგას.
ხელოვნური ინტელექტი უწყვეტი მათემატიკური პროცესია. მილიარდობით პარამეტრი და მუდმივი შესწორება ქმნის „ციფრულ ტვინს“. მას შეუძლია წერა, ხატვა და კოდის შექმნა. ტექნიკა ძლიერდება და მონაცემები იზრდება. ამიტომ AI სულ უფრო ზუსტი ხდება.

