დაკავშირება ჩვენთან ერთად

ხელოვნური ინტელექტი

LightAutoML: AutoML გადაწყვეტა დიდი ფინანსური სერვისების ეკოსისტემისთვის

mm
განახლებულია on

მიუხედავად იმისა, რომ AutoML პოპულარობით სარგებლობდა რამდენიმე წლის წინ, ეალი მუშაობა AutoML თარიღდება 90-იანი წლების დასაწყისით როდესაც მეცნიერებმა გამოაქვეყნეს პირველი ნაშრომები ჰიპერპარამეტრული ოპტიმიზაციის შესახებ. 2014 წელს, როდესაც ICML-მა მოაწყო პირველი AutoML სემინარი, AutoML-მა მიიპყრო ML დეველოპერების ყურადღება. AutoML-ის წლების განმავლობაში ერთ-ერთი მთავარი აქცენტი არის ჰიპერპარამეტრების ძიების პრობლემა, სადაც მოდელი ახორციელებს ოპტიმიზაციის მეთოდების მთელ რიგს, რათა დაადგინოს საუკეთესო მოქმედი ჰიპერპარამეტრები დიდ ჰიპერპარამეტრულ სივრცეში კონკრეტული მანქანათმცოდნეობის მოდელისთვის. კიდევ ერთი მეთოდი, რომელსაც ხშირად იყენებენ AutoML მოდელები, არის იმის ალბათობა, რომ კონკრეტული ჰიპერპარამეტრი იყოს ოპტიმალური ჰიპერპარამეტრი მოცემული მანქანური სწავლის მოდელისთვის. მოდელი ამას აღწევს ბაიესის მეთოდების დანერგვით, რომლებიც ტრადიციულად იყენებენ ისტორიულ მონაცემებს ადრე შეფასებული მოდელებიდან და სხვა მონაცემთა ნაკრებიდან. ჰიპერპარამეტრული ოპტიმიზაციის გარდა, სხვა მეთოდები ცდილობენ შეარჩიონ საუკეთესო მოდელები მოდელირების ალტერნატივების სივრციდან. 

ამ სტატიაში განვიხილავთ LightAutoML, AutoML სისტემას, რომელიც შემუშავებულია ძირითადად ევროპული კომპანიისთვის, რომელიც მუშაობს ფინანსურ სექტორში თავის ეკოსისტემასთან ერთად. LightAutoML ჩარჩო განლაგებულია სხვადასხვა აპლიკაციებში და შედეგებმა აჩვენა უმაღლესი შესრულება, მონაცემთა მეცნიერთა დონესთან შედარებით, თუნდაც მაღალი ხარისხის მანქანათმცოდნეობის მოდელების შექმნისას. LightAutoML ჩარჩო ცდილობს შემდეგი წვლილი შეიტანოს. პირველი, LightAutoML ჩარჩო შეიქმნა ძირითადად დიდი ევროპული ფინანსური და საბანკო ინსტიტუტის ეკოსისტემისთვის. მისი ჩარჩოსა და არქიტექტურის გამო, LightAutoML ჩარჩოს შეუძლია აჯობოს თანამედროვე AutoML ჩარჩოებს რამდენიმე ღია კრიტერიუმში, ისევე როგორც ეკოსისტემის აპლიკაციებში. LightAutoML ჩარჩოს შესრულება ასევე შედარებულია მოდელებთან, რომლებიც ხელით არის მორგებული მონაცემთა მეცნიერების მიერ და შედეგები მიუთითებს LightAutoML ჩარჩოს უფრო ძლიერ შესრულებაზე. 

ეს სტატია მიზნად ისახავს LightAutoML ჩარჩოს სიღრმისეულად გაშუქებას და ჩვენ ვიკვლევთ ფრეიმურის მექანიზმს, მეთოდოლოგიას, არქიტექტურას და მის შედარებას უახლეს ფრეიმიკებთან. მოდით დავიწყოთ. 

LightAutoML: AutoML ჩარჩო ფინანსური სერვისებისთვის

მიუხედავად იმისა, რომ მკვლევარებმა პირველად დაიწყეს AutoML-ზე მუშაობა 90-იანი წლების შუა რიცხვებში და დასაწყისში, AutoML-მა მიიპყრო ყურადღების დიდი ნაწილი ბოლო რამდენიმე წლის განმავლობაში, ზოგიერთი ცნობილი ინდუსტრიული გადაწყვეტილებით, რომლებიც ახორციელებენ ავტომატურად აშენებულ მანქანათმცოდნეობის მოდელებს, არის Amazon-ის AutoGluon, DarwinAI, H20.ai. , IBM Watson AI, Microsoft AzureML და მრავალი სხვა. ამ ჩარჩოების უმრავლესობა ახორციელებს ზოგადი დანიშნულების AutoML გადაწყვეტას, რომელიც ავითარებს ML-ზე დაფუძნებულ მოდელებს ავტომატურად აპლიკაციების სხვადასხვა კლასებში ფინანსური სერვისების, ჯანდაცვის, განათლებისა და სხვა. ძირითადი დაშვება ამ ჰორიზონტალური ზოგადი მიდგომის უკან არის ის, რომ ავტომატური მოდელების შემუშავების პროცესი იდენტური რჩება ყველა აპლიკაციაში. თუმცა, LightAutoML ჩარჩო ახორციელებს ვერტიკალურ მიდგომას AutoML გადაწყვეტის შემუშავებისთვის, რომელიც არ არის ზოგადი, არამედ ემსახურება ინდივიდუალური აპლიკაციების, ამ შემთხვევაში დიდი ფინანსური ინსტიტუტის საჭიროებებს. LightAutoML ჩარჩო არის ვერტიკალური AutoML გადაწყვეტა, რომელიც ფოკუსირებულია რთული ეკოსისტემის მოთხოვნებზე მის მახასიათებლებთან ერთად. პირველი, LightAutoML ჩარჩო უზრუნველყოფს სწრაფ და ოპტიმალურ ჰიპერპარამეტრების ძიებას. მიუხედავად იმისა, რომ მოდელი პირდაპირ არ ახდენს ამ ჰიპერპარამეტრების ოპტიმიზაციას, ის ახერხებს დამაკმაყოფილებელი შედეგების მიწოდებას. გარდა ამისა, მოდელი ინარჩუნებს ბალანსს სიჩქარისა და ჰიპერპარამეტრის ოპტიმიზაციის დინამიკას შორის, რათა უზრუნველყოს მოდელი ოპტიმალური მცირე პრობლემებისთვის და საკმარისად სწრაფი უფრო დიდ პრობლემებზე. მეორე, LightAutoML ჩარჩო ზღუდავს მანქანური სწავლების მოდელების დიაპაზონს მიზანმიმართულად მხოლოდ ორ ტიპზე: ხაზოვანი მოდელები და GBMs ან გრადიენტით გაძლიერებული გადაწყვეტილების ხეები, ნაცვლად სხვადასხვა ალგორითმების დიდი ანსამბლების დანერგვისა. მანქანათმცოდნეობის მოდელების დიაპაზონის შეზღუდვის მთავარი მიზეზი არის LightAutoML ჩარჩოს შესრულების დროის დაჩქარება მოცემული ტიპის პრობლემისა და მონაცემების შესრულებაზე უარყოფითად გავლენის გარეშე. მესამე, LightAutoML ჩარჩო წარმოგიდგენთ წინასწარ დამუშავების სქემების არჩევის უნიკალურ მეთოდს მოდელებში გამოყენებული სხვადასხვა ფუნქციებისთვის გარკვეული შერჩევის წესებისა და მეტასტატისტიკის საფუძველზე. LightAutoML ჩარჩო ფასდება ღია მონაცემთა წყაროების ფართო სპექტრზე აპლიკაციების ფართო სპექტრში. 

LightAutoML: მეთოდოლოგია და არქიტექტურა

LightAutoML ჩარჩო შედგება მოდულებისგან, რომლებიც ცნობილია როგორც Presets, რომლებიც განკუთვნილია მოდელის ბოლომდე შემუშავებისთვის ტიპიური მანქანათმცოდნეობის ამოცანებისთვის. ამჟამად, LightAutoML ჩარჩო მხარს უჭერს წინასწარ დაყენებულ მოდულებს. პირველი, TabularAutoML Preset ფოკუსირებულია კლასიკური მანქანათმცოდნეობის პრობლემების გადაჭრაზე, რომლებიც განსაზღვრულია ცხრილის მონაცემთა ნაკრებებზე. მეორე, White-Box Preset ახორციელებს მარტივ ინტერპრეტაციად ალგორითმებს, როგორიცაა ლოგისტიკური რეგრესია WoE ან Weight of Evidence კოდირების ნაცვლად და დისკრეტირებული ფუნქციები, რათა გადაჭრას ორობითი კლასიფიკაციის ამოცანები ტაბულურ მონაცემებზე. მარტივი ინტერპრეტაციადი ალგორითმების დანერგვა ჩვეულებრივი პრაქტიკაა აპლიკაციის ალბათობის მოდელირებისთვის სხვადასხვა ფაქტორებით გამოწვეული ინტერპრეტაციის შეზღუდვების გამო. მესამე, NLP Preset-ს შეუძლია ცხრილის მონაცემების NLP ან ბუნებრივი ენის დამუშავება ინსტრუმენტები, მათ შორის წინასწარ გაწვრთნილი ღრმა სწავლის მოდელები და სპეციფიკური მახასიათებლების ამომყვანები. და ბოლოს, CV Preset მუშაობს გამოსახულების მონაცემებთან რამდენიმე ძირითადი ხელსაწყოს დახმარებით. მნიშვნელოვანია აღინიშნოს, რომ მიუხედავად იმისა, რომ LightAutoML მოდელი მხარს უჭერს ოთხივე წინასწარ დაყენებას, ჩარჩო იყენებს მხოლოდ TabularAutoML-ს წარმოების დონის სისტემაში. 

LightAutoML ჩარჩოს ტიპიური მილსადენი მოცემულია შემდეგ სურათში. 

თითოეული მილსადენი შეიცავს სამ კომპონენტს. პირველი, Reader, ობიექტი, რომელიც იღებს ამოცანის ტიპს და ნედლეულ მონაცემებს შეყვანის სახით, ახორციელებს გადამწყვეტი მეტამონაცემების გამოთვლებს, ასუფთავებს საწყის მონაცემებს და ადგენს მონაცემთა მანიპულაციებს, რომლებიც უნდა შესრულდეს სხვადასხვა მოდელების დაყენებამდე. შემდეგი, LightAutoML შიდა მონაცემთა ნაკრები შეიცავს CV იტერატორებს და მეტამონაცემებს, რომლებიც ახორციელებენ მონაცემთა ნაკრების ვალიდაციის სქემებს. მესამე კომპონენტი არის მანქანათმცოდნეობის მრავალი მილსადენი დაწყობილი და/ან შერეული ერთი პროგნოზის მისაღებად. მანქანური სწავლების მილსადენი LightAutoML ჩარჩოს არქიტექტურაში არის მანქანური სწავლების მრავალი მოდელიდან, რომელიც იზიარებს მონაცემთა ერთიან ვალიდაციას და წინასწარ დამუშავების სქემას. წინასწარი დამუშავების საფეხურს შეიძლება ჰქონდეს ორი მახასიათებლის შერჩევის საფეხური, ფუნქციის ინჟინერიის ეტაპი ან შეიძლება ცარიელი იყოს, თუ წინასწარი დამუშავება არ არის საჭირო. ML მილსადენები შეიძლება დამოუკიდებლად გამოითვალოს იმავე მონაცემთა ნაკრებებზე და შემდეგ შერეული იყოს საშუალოდ (ან შეწონილი საშუალო) გამოყენებით. ალტერნატიულად, დაწყობის ანსამბლის სქემა შეიძლება გამოყენებულ იქნას მრავალ დონის ანსამბლის არქიტექტურის შესაქმნელად. 

LightAutoML ტაბულური წინასწარ დაყენება

LightAutoML ჩარჩოში, TabularAutoML არის ნაგულისხმევი მილსადენი და ის დანერგილია მოდელში ტაბულურ მონაცემებზე სამი ტიპის ამოცანის გადასაჭრელად: ორობითი კლასიფიკაცია, რეგრესია და მრავალკლასიანი კლასიფიკაცია შესრულების მეტრიკისა და ზარალის ფუნქციების ფართო სპექტრისთვის. ცხრილი შემდეგი ოთხი სვეტით: კატეგორიული მახასიათებლები, რიცხვითი მახასიათებლები, დროის ანაბეჭდები და ერთი სამიზნე სვეტი კლასის ლეიბლებით ან უწყვეტი მნიშვნელობით მიეწოდება TabularAutoML კომპონენტს შეყვანის სახით. LightAutoML ჩარჩოს დიზაინის ერთ-ერთი მთავარი მიზანი იყო სწრაფი ჰიპოთეზის ტესტირებისთვის ხელსაწყოს შემუშავება, მთავარი მიზეზი იმისა, თუ რატომ ერიდება უხეში ძალის მეთოდების გამოყენებას მილსადენის ოპტიმიზაციისთვის და ფოკუსირებულია მხოლოდ ეფექტურობის ტექნიკასა და მოდელებზე, რომლებიც მუშაობენ მთელ მსოფლიოში. მონაცემთა ნაკრების ფართო სპექტრი. 

ავტომატური აკრეფა და მონაცემთა წინასწარი დამუშავება

სხვადასხვა ტიპის ფუნქციების სხვადასხვა გზით დასამუშავებლად, მოდელმა უნდა იცოდეს თითოეული მახასიათებლის ტიპი. იმ სიტუაციაში, როდესაც არის ერთი დავალება მცირე მონაცემთა ნაკრებით, მომხმარებელს შეუძლია ხელით მიუთითოს თითოეული ფუნქციის ტიპი. თუმცა, თითოეული ფუნქციის ტიპის ხელით დაკონკრეტება აღარ არის ეფექტური ვარიანტი სიტუაციებში, რომლებიც მოიცავს ასობით ამოცანას მონაცემთა ნაკრებით, რომელიც შეიცავს ათასობით ფუნქციას. TabularAutoML Preset-ისთვის, LightAutoML ჩარჩოს სჭირდება მახასიათებლები სამ კლასად: რიცხვითი, კატეგორია და თარიღის დრო. ერთი მარტივი და აშკარა გამოსავალი არის სვეტების მასივის მონაცემთა ტიპების გამოყენება, როგორც ფაქტობრივი ფუნქციების ტიპები, ანუ float/int სვეტების დასახატად ციფრულ მახასიათებლებზე, დროის ნიშანზე ან სტრიქონზე, რომელიც შეიძლება გაანალიზდეს როგორც დროის შტამპი - თარიღის დრო და სხვები კატეგორიაში. თუმცა, ეს რუკა არ არის საუკეთესო იმის გამო, რომ ციფრული მონაცემების ტიპები ხშირია კატეგორიის სვეტებში. 

ვალიდაციის სქემები

ვალიდაციის სქემები AutoML ჩარჩოების სასიცოცხლო კომპონენტია, რადგან ინდუსტრიაში მონაცემები ექვემდებარება ცვლილებას დროთა განმავლობაში და ცვლილების ეს ელემენტი IID-ს ან დამოუკიდებელ იდენტურად განაწილებულ ვარაუდებს არარელევანტურს ხდის მოდელის შემუშავებისას. AutoML მოდელები იყენებენ ვალიდაციის სქემებს მათი შესრულების შესაფასებლად, ჰიპერპარამეტრების მოსაძებნად და პროგნოზების წარმოქმნის მიზნით. TabularAutoML მილსადენი ახორციელებს ვალიდაციის სამ სქემას:

  • KFold Cross Validation: KFold Cross Validation არის ნაგულისხმევი ვალიდაციის სქემა TabularAutoML მილსადენისთვის, მათ შორის GroupKFold ქცევითი მოდელებისთვის და სტრატიფიცირებული KFold კლასიფიკაციის ამოცანებისთვის. 
  • Holdout Validation: Holdout ვალიდაციის სქემა განხორციელდება, თუ მითითებულია Holdout-ის ნაკრები. 
  • მორგებული ვალიდაციის სქემები: მორგებული ვალიდაციის სქემები შეიძლება შეიქმნას მომხმარებლების მიერ მათი ინდივიდუალური მოთხოვნების მიხედვით. მორგებული ვალიდაციის სქემები მოიცავს ჯვარედინი ვალიდაციას და დროის სერიების გაყოფის სქემებს. 

მხატვრული შერჩევა

მიუხედავად იმისა, რომ მახასიათებლების შერჩევა არის გადამწყვეტი ასპექტი მოდელების შემუშავებაში ინდუსტრიის სტანდარტების მიხედვით, რადგან ეს ხელს უწყობს დასკვნის და მოდელის დანერგვის ხარჯების შემცირებას, AutoML გადაწყვეტილებების უმეტესობა დიდად არ ამახვილებს ყურადღებას ამ პრობლემაზე. პირიქით, TabularAutoML მილსადენი ახორციელებს სამ მახასიათებლის შერჩევის სტრატეგიას: შერჩევა არ არის, მნიშვნელობის შეწყვეტის შერჩევა და მნიშვნელოვნებაზე დაფუძნებული წინსვლის შერჩევა. სამიდან, მნიშვნელობის შეწყვეტის შერჩევის ფუნქციის შერჩევის სტრატეგია ნაგულისხმევია. გარდა ამისა, არსებობს ორი ძირითადი გზა მახასიათებლის მნიშვნელობის შესაფასებლად: გაყოფაზე დაფუძნებული ხის მნიშვნელობა და GBM მოდელის ან გრადიენტის გაძლიერებული პერმუტაციის მნიშვნელობა. გადაწყვეტილების ხეები. მნიშვნელობის წყვეტის შერჩევის უპირველესი მიზანია უარი თქვას მახასიათებლებზე, რომლებიც არ არის გამოსადეგი მოდელისთვის, რაც საშუალებას აძლევს მოდელს შეამციროს ფუნქციების რაოდენობა შესრულებაზე უარყოფითი ზემოქმედების გარეშე, მიდგომა, რომელმაც შეიძლება დააჩქაროს მოდელის დასკვნა და ტრენინგი. 

ზემოთ მოცემული სურათი ადარებს შერჩევის სხვადასხვა სტრატეგიებს ბინარული ბანკების მონაცემთა ნაკრებებზე. 

ჰიპერპარამეტრის დარეგულირება

TabularAutoML მილსადენი ახორციელებს განსხვავებულ მიდგომებს ჰიპერპარამეტრების დასარეგულირებლად იმის მიხედვით, თუ რა არის მორგებული. 

  • ადრეული შეჩერების ჰიპერპარამეტრის დარეგულირება ირჩევს გამეორებების რაოდენობას ყველა მოდელისთვის სასწავლო ფაზის განმავლობაში. 
  • საექსპერტო სისტემის ჰიპერპარამეტრების დარეგულირება არის მარტივი გზა მოდელებისთვის ჰიპერპარამეტრების დამაკმაყოფილებლად დასაყენებლად. ის ხელს უშლის საბოლოო მოდელს ქულების მაღალი დაკლებისგან მყარად მორგებულ მოდელებთან შედარებით.
  • ხე სტრუქტურირებული Parzen შეფასება ან TPE GBM ან გრადიენტით გაძლიერებული გადაწყვეტილების ხის მოდელებისთვის. TPE არის შერეული დარეგულირების სტრატეგია, რომელიც არის ნაგულისხმევი არჩევანი LightAutoML მილსადენში. თითოეული GMB ჩარჩოსთვის LightAutoML Framework ავარჯიშებს ორ მოდელს: პირველი იღებს ექსპერტის ჰიპერპარამეტრებს, მეორე სრულყოფილად არის მორგებული დროის ბიუჯეტში. 
  • Grid Search Hyperparameter Tuning დანერგილია TabularAutoML მილსადენში წრფივი მოდელის რეგულარიზაციის პარამეტრების სრულყოფილად დასარეგულირებლად ადრეული გაჩერებისა და თბილ დაწყებასთან ერთად. 

მოდელი არეგულირებს ყველა პარამეტრს მეტრიკული ფუნქციის მაქსიმიზაციის გზით, რომელიც განსაზღვრულია მომხმარებლის მიერ ან ნაგულისხმევია ამოხსნილი ამოცანისთვის. 

LightAutoML: ექსპერიმენტი და შესრულება

შესრულების შესაფასებლად, LightAutoML ჩარჩოში TabularAutoML Preset შედარებულია უკვე არსებულ ღია კოდის გადაწყვეტილებებთან სხვადასხვა ამოცანებში და ამტკიცებს LightAutoML ჩარჩოს მაღალ შესრულებას. პირველ რიგში, შედარება ხორციელდება OpenML ბენჩმარკზე, რომელიც შეფასებულია 35 ორობითი და მრავალკლასიანი კლასიფიკაციის ამოცანების მონაცემთა ნაკრებზე. შემდეგი ცხრილი აჯამებს LightAutoML ჩარჩოს შედარებას არსებულ AutoML სისტემებთან. 

როგორც ხედავთ, LightAutoML ჩარჩო აღემატება ყველა სხვა AutoML სისტემას 20 მონაცემთა ნაკრებზე საორიენტაციო ნიშნის ფარგლებში. შემდეგი ცხრილი შეიცავს დეტალურ შედარებას მონაცემთა ნაკრების კონტექსტში, რაც მიუთითებს იმაზე, რომ LightAutoML აწვდის განსხვავებულ შესრულებას დავალებების სხვადასხვა კლასში. ორობითი კლასიფიკაციის ამოცანებისთვის, LightAutoML-ს აკლდება შესრულება, ხოლო ამოცანების დიდი რაოდენობით მონაცემებისთვის, LightAutoML ჩარჩო უზრუნველყოფს უმაღლესი შესრულებას.

შემდეგი ცხრილი ადარებს LightAutoML ჩარჩოს მუშაობას AutoML სისტემების მიმართ 15 ბანკის მონაცემთა ნაკრებზე, რომლებიც შეიცავს სხვადასხვა ორობითი კლასიფიკაციის ამოცანების კომპლექტს. როგორც ჩანს, LightAutoML აღემატება ყველა AutoML გადაწყვეტილებებს 12 მონაცემთა ნაკრებიდან 15-ზე, მოგების პროცენტული მაჩვენებელი 80. 

საბოლოო ფიქრები

ამ სტატიაში ვისაუბრეთ LightAutoML-ზე, AutoML სისტემაზე, რომელიც შემუშავებულია ძირითადად ევროპული კომპანიისთვის, რომელიც მუშაობს ფინანსურ სექტორში თავის ეკოსისტემასთან ერთად. LightAutoML ჩარჩო განლაგებულია სხვადასხვა აპლიკაციებში და შედეგებმა აჩვენა უმაღლესი შესრულება, მონაცემთა მეცნიერთა დონესთან შედარებით, თუნდაც მაღალი ხარისხის მანქანათმცოდნეობის მოდელების შექმნისას. LightAutoML ჩარჩო ცდილობს შემდეგი წვლილი შეიტანოს. პირველი, LightAutoML ჩარჩო შეიქმნა ძირითადად დიდი ევროპული ფინანსური და საბანკო ინსტიტუტის ეკოსისტემისთვის. მისი ჩარჩოსა და არქიტექტურის გამო, LightAutoML ჩარჩოს შეუძლია აჯობოს თანამედროვე AutoML ჩარჩოებს რამდენიმე ღია კრიტერიუმში, ისევე როგორც ეკოსისტემის აპლიკაციებში. LightAutoML ჩარჩოს შესრულება ასევე შედარებულია მოდელებთან, რომლებიც ხელით არის მორგებული მონაცემთა მეცნიერების მიერ და შედეგები მიუთითებს LightAutoML ჩარჩოს უფრო ძლიერ შესრულებაზე. 

"პროფესიით ინჟინერი, ზეპირად მწერალი". კუნალი არის ტექნიკური მწერალი, რომელსაც აქვს AI და ML ღრმა სიყვარული და გაგება, რომელიც ეძღვნება ამ სფეროებში რთული კონცეფციების გამარტივებას მისი საინტერესო და ინფორმაციული დოკუმენტაციის საშუალებით.