Ev, dizayn, təmir, dekorasiya.  Həyət və bağ.  DIY

Ev, dizayn, təmir, dekorasiya. Həyət və bağ. DIY

» "Böyük məlumat alimi orta bir şirkətin baş direktoru kimi maaş alır." Verilənlərin gələcəyi proqnozlaşdırdığı və dünyanı necə formalaşdırdığına dair Yandex.Taxi maşın öyrənmə mütəxəssisi

"Böyük məlumat alimi orta bir şirkətin baş direktoru kimi maaş alır." Verilənlərin gələcəyi proqnozlaşdırdığı və dünyanı necə formalaşdırdığına dair Yandex.Taxi maşın öyrənmə mütəxəssisi

- Maşın öyrənmənin necə işlədiyini demək üçün tamamilə primitiv bir nümunədən istifadə edə bilərsinizmi?

Mən bacarıram. Ən qədim şeylərdən biri olan Qərar Ağacı adlı maşın öyrənmə metodunun bir nümunəsi var. Gəlin bunu indi edək. Tutaq ki, mücərrəd bir şəxs sizi görüşə dəvət edir. Sizin üçün vacib olan nədir?

Əvvəla, onu tanıyıb-tanımamağım...

(Viktor bunu lövhəyə yazır.)

…Bilmirəmsə, o zaman onun cəlbedici olub-olmaması sualına cavab verməliyəm.

Və bilirsənsə, fərq etməz? Düşünürəm ki, başa düşdüm, bu, dost zonasının bir qoludur! Ümumiyyətlə, yazıram, əgər bilmirsinizsə və cəlbedici deyilsinizsə, cavab "bəli, yox, yəqin ki," olacaq. Bilirsinizsə, cavab bəlidir.

- Bilsəm, bu da vacibdir!

Xeyr, bu, dost zonasının bir qolu olacaq.

Yaxşı, onda maraqlı olub-olmadığını burada qeyd edək. Buna baxmayaraq, bir insanı tanımadığınız zaman ilk reaksiya görünüşdür, bir dostumuzla onun nə düşündüyünə və necə olduğuna baxırıq.

Gəlin bunu fərqli edək. İddialı ya yox. Əgər iddialıdırsa, o zaman onunla dostluq etmək çətin olacaq, daha çoxunu istəyəcək. Və iddiasızlar əziyyət çəkəcəklər.

(Viktor qərar ağacını tamamlayır.)

Hazır. İndi hansı oğlanla görüşmək ehtimalının daha yüksək olduğunu təxmin edə bilərsiniz. Yeri gəlmişkən, bəzi tanışlıq xidmətləri belə şeyləri proqnozlaşdırır. Analoji olaraq, müştərilərin nə qədər mal alacağını və günün bu vaxtında insanların harada olacağını təxmin edə bilərsiniz.

Cavablar təkcə “bəli” və “yox” deyil, həm də rəqəmlər şəklində ola bilər. Daha dəqiq bir proqnoz istəyirsinizsə, bir neçə belə ağac düzəldə bilərsiniz və onların üzərində orta hesabla. Və belə sadə bir şeylə, həqiqətən, gələcəyi təxmin edə bilərsiniz.

İndi təsəvvür edin, iki yüz il əvvəl insanlar üçün belə bir sxem hazırlamaq nə qədər çətin idi? Qətiyyən! Bu sxem heç bir raket elmini daşımır. Bir fenomen olaraq maşın öyrənməsi təxminən yarım əsrdir ki, mövcuddur. Ronald Fisher 20-ci əsrin əvvəllərində məlumatlara əsaslanaraq proqnozlaşdırmağa başladı. O, süsən götürdü və onları sepals və ləçəklərin uzunluğu və eni boyunca payladı, bu parametrlərə görə bitki növünü təyin etdi.

Maşın öyrənmə sənayesi son onilliklərdə fəal şəkildə istifadə olunur: böyük miqdarda məlumatların emal edilməsi üçün lazım olan güclü və nisbətən ucuz maşınlar, məsələn, bu cür qərar ağacları üçün çox yaxınlarda ortaya çıxdı. Ancaq yenə də nəfəs kəsicidir: biz bunları hər tapşırıq üçün çəkirik və gələcəyi proqnozlaşdırmaq üçün istifadə edirik.

- Əlbəttə ki, futbol matçlarını proqnozlaşdıran hər hansı bir ahtapotdan yaxşı deyil ...

Yox, yaxşı, biz ahtapotların qayğısına qalırıq. Baxmayaraq ki, bizdə daha çox dəyişkənlik var. İndi maşın öyrənməsinin köməyi ilə siz vaxta, pula qənaət edə və həyatın rahatlığını yaxşılaşdıra bilərsiniz. Maşın öyrənməsi bir neçə il əvvəl şəkilləri təsnif etməyə gələndə insanı məğlub etdi. Məsələn, bir kompüter 20 cins teriyeri tanıya bilər və adi insan yox.

- Bəs siz istifadəçiləri təhlil edəndə hər bir şəxs sizin üçün nömrələr toplusudur?

Kobud desək, bəli. Biz verilənlərlə işləyərkən biz bütün obyektləri, o cümlədən istifadəçi davranışını müəyyən rəqəmlər dəsti ilə təsvir edirik. Və bu rəqəmlər insanların davranış xüsusiyyətlərini əks etdirir: nə qədər tez-tez taksiyə minir, hansı sinif taksidən istifadə edir, adətən hansı yerlərə gedir.

İndi biz oxşar davranışa malik insan qruplarını müəyyən etmək üçün fəal şəkildə oxşar modellər qururuq. Yeni bir xidmət təqdim etdikdə və ya köhnəsini tanıtmaq istədikdə, onu maraqlananlara təklif edirik.

Məsələn, burada bir xidmətimiz var - taksidə iki uşaq oturacağı. Biz bu xəbərlə hər kəsə spam göndərə bilərik və ya bunu yalnız müəyyən bir dairəyə ünvanlaya bilərik. İl ərzində şərhlərdə iki uşaq oturacağına ehtiyac olduğunu yazan müəyyən sayda istifadəçi topladıq. Biz onları və onlar kimi insanları tapdıq. Şərti olaraq bunlar müntəzəm səyahət edən və Aralıq dənizi mətbəxini sevən 30 yaşdan yuxarı insanlardır. Əlbəttə ki, daha çox əlamətlər olsa da, nümunə üçün bu mənəm.

- Hətta belə incəliklər?

Bu sadə məsələdir. Hər şey axtarış sorğularından istifadə etməklə hesablanır.

Və tətbiqdə birtəhər işləyə bilərmi? Məsələn, siz bilirsiniz ki, mən dilənçiyəm və “Ayda 500 rubla necə dolanmaq olar” kimi qruplara abunə olursunuz – onlar mənə ancaq döyülmüş ucuz avtomobillər təklif edirlər, mən SpaceX xəbərlərinə abunə oluram – və vaxtaşırı Tesla alıram?

Bu şəkildə işləyə bilər, lakin Yandex-də belə şeylər təsdiqlənmir, çünki bu ayrı-seçkilikdir. Bir xidməti fərdiləşdirdiyiniz zaman ən məqbul olanı deyil, ən yaxşısını və insanın bəyəndiyini təklif etmək daha yaxşıdır. “Buna daha yaxşı maşın lazımdır, buna daha yaxşı maşın lazımdır” məntiqinə görə bölgü pisdir.


Hər kəsin təhrif edilmiş arzuları var və bəzən Aralıq dənizi yeməyi üçün bir resept deyil, məsələn, koprofiliya haqqında şəkillər tapmaq lazımdır. Fərdiləşdirmə bu halda da işləyəcəkmi?

Şəxsi rejim həmişə var.

Əgər heç kimin maraqlarım haqqında bilməsini istəmirəmsə və ya deyək ki, dostlar yanıma gəlib bir az zibil izləmək istəyirlərsə, inkoqnito rejimindən istifadə etmək daha yaxşıdır.

Siz həmçinin hansı şirkətin xidmətindən istifadə edəcəyinizə qərar verə bilərsiniz, məsələn, Yandex və ya Google.

- Fərq varmı?

Kompleks məsələ. Başqalarını bilmirəm, amma Yandex şəxsi məlumatların qorunmasına ciddi yanaşır. Xüsusilə işçilərə nəzarət edin.

- Yəni bir oğlanla ayrılsam, onun bu daçaya gedib-getmədiyini öyrənə bilməyəcəm?

Yandex-də işləsəniz belə. Bu, əlbəttə ki, kədərlidir, amma bəli, bunu öyrənmək mümkün olmayacaq. Əksər işçilərin bu məlumatlara çıxışı belə yoxdur. Hər şey şifrələnir. Çox sadədir: siz insanlara casusluq edə bilməzsiniz, bu, şəxsi məlumatdır.

Yeri gəlmişkən, oğlanlarla ayrılmaq mövzusunda maraqlı bir işimiz oldu. Taksidə təyinat nöqtəsi olan "B" nöqtəsinin proqnozunu verəndə göstərişlər təqdim etdik. Bax.

(Viktor Yandex.Taxi tətbiqinə daxil olur.)

Məsələn, taksi mənim evdə olduğumu düşünür. O, mənə ya işə getməyi, ya da RUDN Universitetinə getməyi təklif edir (Fəaliyyətdə Data Mining maşın öyrənməsi kursunun bir hissəsi kimi orada mühazirələr verirəm). Və bir nöqtədə, bu göstərişləri inkişaf etdirərkən anladıq ki, istifadəçiyə güzəştə getməməliyik. "B" nöqtəsi hər kəs görə bilər. Bu səbəblərə görə oxşarlığa görə yer təklif etməkdən imtina etdik. Sonra layiqli insanlarla layiqli bir yerdə oturursan, taksi sifariş edirsən və orada sənə yazırlar: "Bax, sən hələ bu barda olmamısan!"

- Nə mavi nöqtələr xəritənizdə yanıb-sönür?

Bunlar qəbul nöqtələridir. Bu nöqtələr taksi çağırmağın ən əlverişli olduğunu göstərir. Axı, zəng etmək olduqca əlverişsiz olacaq bir yerə zəng edə bilərsiniz. Amma ümumiyyətlə, istənilən yerə zəng etmək olar.

- Bəli, istənilən halda. Mən onunla birtəhər iki blok uçdum.

Son zamanlar GPS ilə bağlı müxtəlif çətinliklər yaranıb və bu da müxtəlif gülməli vəziyyətlərə gətirib çıxarıb. İnsanlar, məsələn, Tverskayada, Sakit Okean boyunca naviqasiya ilə köçürüldü. Gördüyünüz kimi, bəzən buraxılmış və iki blokdan çox olur.

- Proqramı yenidən başladın və yenidən soxsanız, qiymət bir neçə rubl dəyişir. Niyə?

Tələb təklifi üstələyirsə, alqoritm avtomatik olaraq multiplikator yaradır - bu, mümkün qədər tez yola düşməli olanlara tələbatın yüksək olduğu dövrlərdə belə taksidən istifadə etməyə kömək edir. Yeri gəlmişkən, maşın öyrənməsindən istifadə edərək, məsələn, bir saat ərzində daha çox tələbatın harada olacağını təxmin edə bilərsiniz. Bu, tədarükün tələbə uyğun olması üçün sürücülərə daha çox sifarişin harada olacağını söyləməyə kömək edir.

- Sizə elə gəlmir ki, “Yandex.Taxi” tezliklə bütün taksi bazarını öldürəcək?

Məncə yox. Biz sağlam rəqabətin tərəfdarıyıq və bundan qorxmuruq.

Mən özüm, məsələn, müxtəlif taksi xidmətlərindən istifadə edirəm. Gözləmə müddəti mənim üçün vacibdir, ona görə də hansı taksinin daha tez çatacağına dair bir neçə proqrama baxıram.


- Uber ilə əməkdaşlıq etmisiniz. Nə üçün?

Şərh etmək mənim yerim deyil. Düşünürəm ki, birləşmək son dərəcə məntiqli qərardır.

Almaniyada bir oğlan dronlara vanna quraşdırdı və burger üçün uçdu. Hava məkanını mənimsəməyin vaxtı olduğunu düşünmüsünüzmü?

Mən hava məkanlarını bilmirəm. Xəbərləri “Uber-in işə salınan taksi qayıqları” ruhu ilə izləyirik, amma hava haqqında heç nə deyə bilmərəm.

Bəs dron taksiləri?

Burada maraqlı bir məqam var. Biz onları inkişaf etdiririk, lakin onlardan dəqiq necə istifadə edəcəyimizi düşünməliyik. Onların küçələrdə necə və nə vaxt peyda olacağını təxmin etmək hələ tezdir, lakin biz tam avtonom avtomobil üçün texnologiya hazırlamaq üçün çox çalışırıq, burada insan sürücüsünə heç ehtiyac yoxdur.

- Dronların proqram təminatının sındırılaraq maşını uzaqdan idarə edə biləcəyi ilə bağlı narahatlıqlar varmı?

Risklər texnologiya və qadcetlərin olduğu hər zaman və hər yerdə olur. Ancaq texnologiyanın inkişafı ilə yanaşı, başqa bir istiqamət inkişaf edir - onların qorunması və təhlükəsizliyi. Texnologiyanın inkişafı ilə bu və ya digər şəkildə məşğul olan hər kəs mühafizə sistemləri üzərində işləyir.

- Hansı istifadəçi məlumatlarını toplayır və onları necə qoruyursunuz?

Hara, nə vaxt və hara səyahət etmisiniz kimi müəyyən edilməmiş istifadə məlumatlarını toplayırıq. Əhəmiyyətli olan hər şey hash edilmişdir.

- Sizcə, dronlar iş yerlərinin sayını azaldacaqmı?

Düşünürəm ki, daha da böyüyəcək. Yenə də bu dronlara hansısa şəkildə texniki xidmət göstərilməlidir. Bu, əlbəttə ki, bir az stresli bir vəziyyətdir, ixtisasınızı dəyişdirir, amma nə edə bilərsiniz.

- Qref hər mühazirəsində deyir ki, insan öz peşəsini ən azı üç dəfə kəskin dəyişəcək.

Mən əbədi olan heç bir ixtisasın adını çəkə bilmərəm. Tərtibatçı bütün həyatı boyu eyni dildə və eyni texnologiyalarla işləmir. Hər yeri yenidən qurmaq lazımdır. Maşın öyrənməsi ilə məndən altı yaş kiçik uşaqların məndən necə daha sürətli olduğunu aydın hiss edə bilirəm. Eyni zamanda, 40-45 yaşlarında olan insanlar bunu daha güclü hiss edirlər.

Təcrübə artıq əhəmiyyət kəsb etmir?

oynayır. Amma üsullar dəyişir, məsələn, dərindən öyrənmənin tətbiq olunmadığı sahəyə gələ bilərsiniz, bir müddət orada işləyirsən, sonra hər yerdə dərin öyrənmə üsulları tətbiq olunur və bu barədə heç nə başa düşmürsən. Və bu qədər. Təcrübəniz həmişə deyil, yalnız komandanın planlaşdırılması məsələsində faydalı ola bilər.

- Peşəniz data alimidir, buna tələbat varmı?

Məlumat alimlərinə tələbat sürətlə artır. Aydındır ki, indi dəlilik dövrüdür. Allaha şükürlər olsun ki, blokçeyn bu şırınganın səngiməsinə bir az da kömək etdi. Blockchain mütəxəssisləri daha sürətli sökülür.

Ancaq indi bir çox şirkətlər maşın öyrənməsinə sərmayə qoysalar, bağlarının dərhal çiçəklənəcəyini düşünürlər. Bu doğru deyil. Maşın öyrənməsi yalnız mövcud deyil, xüsusi problemləri həll etməlidir.

Bankın istifadəçilər üçün tövsiyə xidməti sistemi yaratmaq istədiyi vaxtlar olur. Biz soruşuruq: “Sizcə, iqtisadi cəhətdən əsaslandırılacaqmı?” Cavab verirlər: “Bəli, bizi maraqlandırmır. Et bunu. Hər kəsin tövsiyə sistemləri var, biz trenddə olacağıq”.

Ağrı odur ki, biznes üçün həqiqətən faydalı bir şey bir gündə edilə bilməz. Sistemin necə öyrədiləcəyini görməliyik. Və o, həmişə başlanğıcda səhvlərlə işləyir, məşq zamanı bəzi məlumatlar olmaya bilər. Səhvləri düzəldin, sonra yenidən düzəldin və hətta hər şeyi yenidən edin. Bundan sonra onu konfiqurasiya etməlisiniz ki, sistem istehsalda işləsin, sabit və miqyaslı olsun, bu hələ vaxtdır. Nəticədə bir layihə altı ay, bir il və ya daha çox vaxt aparır.


Maşın öyrənmə üsullarına qara qutu kimi baxsanız, o zaman bəzi cəfəngiyyatların necə baş verdiyini asanlıqla əldən verə bilərsiniz. Bir saqqallı hekayə var. Hərbçilər şəkildəki tankın olub-olmadığını təhlil etmək üçün istifadə edilə bilən alqoritm hazırlamağı xahiş ediblər. Tədqiqatçılar düzəltdilər, sınaqdan keçirdilər, keyfiyyət əladır, hər şey əladır, əsgərlərə verdilər. Hərbçilər gəlib deyirlər ki, heç nə işləmir. Alimlər əsəbi şəkildə anlamağa başlayırlar. Məlum olub ki, hərbçilərin gətirdiyi tank olan bütün şəkillərdə küncdə qələmlə işarə varmış. Alqoritm gənə tapmağı mükəmməl öyrəndi, tank haqqında heç nə bilmirdi. Təbii ki, yeni şəkillərdə heç bir işarə yox idi.

Öz dialoq sistemlərini inkişaf etdirən uşaqlarla tanış oldum. Uşaqlarla əməkdaşlıq etməyiniz lazım olduğunu heç düşünmüsünüzmü?

Mən uzun müddətdir ki, məktəblilər üçün hər cür tədbirlərə gedirəm, maşın öyrənməsi haqqında mühazirələr verirəm. Yeri gəlmişkən, mövzulardan birini mənə onuncu sinif şagirdi keçib. Hekayəmin yaxşı və maraqlı olacağına tam əmin idim, özümlə fəxr etdim, yayıma başladım və qız dedi: "Ah, bu şeyi minimuma endirmək istəyirik." Baxıram və düşünürəm, amma həqiqətən, niyə və həqiqəti minimuma endirmək olar və burada sübut etmək üçün xüsusi bir şey yoxdur. Artıq bir neçə il keçib, indi o, Phystech-in tələbəsi kimi mühazirələrimizi dinləyir. Yeri gəlmişkən, Yandex-də məktəblilərin əsas proqramlaşdırma biliklərini pulsuz əldə edə biləcəyi Yandex.Lisey var.

- Hazırda maşın öyrənməsinin tədris olunduğu universitetlərə və fakültələrə məsləhət verin.

Moskva Fizika və Texnologiya İnstitutu, FIVT və FUPM fakültələri var. SƏTƏM-də kompüter elmləri və Moskva Dövlət Universitetində maşın öyrənməsinin gözəl bir kafedrası da var. Yaxşı, indi RUDN Universitetində kursumuzu dinləyə bilərsiniz.

Dediyim kimi, bu peşəyə tələbat var. Çox uzun müddət texniki təhsil almış insanlar tamam başqa işlərlə məşğul olurdular. Maşın öyrənməsi insanların öyrəndiyi hər şeyin gözəl nümunəsidir texniki təhsil, indi birbaşa lazımdır, faydalı və yaxşı ödənilir.

- Nə yaxşı?

Məbləği adlandırın.

- ayda 500 min.

Siz adi bir məlumat alimi olmaya bilərsiniz. Amma bəzi şirkətlərdə çox, çox kursant sadə bir işə görə 50 min ala bilir.Çox geniş yayılma var. Ümumiyyətlə, sərin data aliminin maaşını hansısa orta şirkətin baş direktorunun maaşı ilə müqayisə etmək olar. Bir çox şirkətlərdə maaşdan əlavə, işçinin üzərinə çoxlu yaxşılıqlar düşür və əgər adamın CV-də yaxşı brend yazmağa deyil, həqiqətən işləməyə gəldiyi aydındırsa, onda hər şey yaxşı olacaq. Ona.

FIFT-də qeyri-adi bir mövzunun - innovativ seminarın başlamasından təxminən bir il keçdi. Onun mahiyyəti təcrübəli mentorların rəhbərliyi altında tələbə komandaları tərəfindən İT startaplarının yaradılmasıdır. Pis olmadı: kurs sayəsində kimsə yayın bir hissəsini Kremieva Vadisində keçirdi, kimsə layihənin inkişafı üçün 800.000 rubl məbləğində qrant aldı və ABBYY layihəni tamamilə kimsədən almağa hazırdır. Və bu seminarın bütün nəticələri deyil!

2011-ci ilin əvvəlində FIVT 3-cü kurs tələbələri Akt zalında toplandı və onlara məlumat verildi: növbəti ilöz başlanğıcınızı yaratmalı olacaqsınız. Tələbələr bu fikri birmənalı qarşıladılar: bunu necə etmək ümumiyyətlə aydın deyildi, məsuliyyət isə qeyri-adi idi - axır ki, başqa bir təhsil layihəsi deyil, texnologiya biznesi yaratmaq lazım idi. Fizika üzrə MIPT Tələbə Olimpiadasının qalibi, Yandeska şöbəsinin tələbəsi Viktor Kantorun bu haqda fikirləri belədir:

Qəbul zamanı FIVT-ni seçəndə ümid edirdim ki, bizdə də oxşar bir şey olacaq. Buna görə də boşuna ümid etmədiyim üçün sevinirəm. İl ərzində hiss olunurdu ki, kurs hələ formalaşır, çoxu yenidir, bir çox məsələlər təkcə tələbələr üçün deyil, təşkilatçılar üçün də mübahisəlidir, amma ümumilikdə, məncə, tendensiyalar müsbətdir. Bu kursu bəyəndim.

Tələbələrin işini asanlaşdırmaq üçün innovativ biznes qurmaq üçün öz ideyalarını təklif etmək üçün müxtəlif kuratorlar dəvət olunub. Onların arasında tamamilə fərqli insanlar var idi: Moskva Fizika və Texnologiya İnstitutunun yuxarı kurs tələbələri və aspirantlarından tutmuş Ernst & Young-ın innovasiyalar üzrə məsləhətçisi Yuri Pavloviç Ammosova (o, bütün kursun rəhbəri idi) və regenerativ tibb və həyatla məşğul olan Mixail Batinə qədər. uzadılması problemləri. Nəticədə fiziklər özləri üçün ən maraqlı olan ideyaları seçdilər, kuratorlar komandalara bağlandılar və çətin, lakin həyəcanlı işə başladılar.

O vaxtdan keçən təxminən bir il ərzində uşaqlar bir çox problemlərlə üzləşdilər, bəziləri həll edildi. İndi onların nəticələrini qiymətləndirə bilərsiniz - çətinliklərə baxmayaraq, uşaqlar bacardılar. MIPT tələbələri (fizika fakültəsindən əlavə, FAPF-nin bəzi tələbələri və digər fakültələr prosesə qoşuldular) bir neçə kifayət qədər maraqlı və real layihələr hazırlamağı bacardılar:

Askeroid (əvvəllər Ask Droid) - smartfonları axtarın ( Anastasiya Uryasheva)

Çox sayda axtarış sistemində rahatlıqla axtarış etməyə imkan verən Android proqramı. Bəzi ekspertlər inkişafa maraq göstərdilər və nəticədə Anastasiya bütün keçən yayı Silikon Vadisində ən məşhur inkubatorlardan birində - Plug&Play-da keçirdi. texnologiya sahibkarlığının əsaslarını öyrənmək və beynəlxalq vençur kapitalı ekspertləri ilə söhbət etmək.

1minute.ru - yaxşılığa bir dəqiqə (Lev Grunin)

Bu layihə hər kəsə sadə, tez və tamamilə pulsuz olaraq xeyriyyə işləri ilə məşğul olmağa imkan verir. Model sadədir: reklamçılar saytda bir sıra fəaliyyətlər təklif edirlər, istifadəçilər könüllü olaraq onlarda iştirak edirlər və bütün reklam pulları xeyriyyə fonduna köçürülür. Başlanğıcdan bir həftə sonra layihə 6500-dən çox istifadəçi topladı və bununla da dayanmaq niyyətində deyil. Nəticədə Lev və komandasının sayəsində uşaq evlərindən 600 uşaq alacaq Yeni il Santa Klausdan əziz hədiyyələr. Artıq bir dəqiqənizi yaxşı bir işə sərf etmisiniz?!

Quraşdırılmış Masaüstü - telefonunuzdakı kompüter (Aleksey Vukolov)

Kompüterin imkanlarını və telefonun hərəkətliliyini bir halda birləşdirməyə imkan verən proqram son dərəcədir faydalı məhsul tez-tez işgüzar səfərlərə gedən məşğul insanlar üçün. Bunu bir smartfona quraşdırmaq kifayətdir və istifadəçi istənilən oteldə, ofisdə və həqiqətən də monitor (televizor da uyğundur), klaviatura və siçan tapa biləcəyiniz hər yerdə öz kompüterini "əldə edə" biləcək. . Layihə ideyanın inkişafı üçün qrant alıb və “Technovation Cup” sərgisində təqdim olunub və komanda artıq alınan pulla aktiv şəkildə avadanlıq alır. MIPS prosessorlarının Amerika istehsalçısı inkişafda son dərəcə maraqlıdır.

Smart Tagger - sənədlər vasitəsilə semantik axtarış (Viktor Kantor)

Bunu bir yerdə xatırlasanız nə etməli poçt qutusu Böyük Partlayış Nəzəriyyəsinin son seriyasından bəhs edən çox vacib bir məktub var idi, amma mətndən heç bir açar sözləri xatırlamırsınız? Yandex və Google axtarışı gücsüzdür. Smart Tagger-in inkişafı köməyə gələcək - semantik axtarışdan istifadə edən "ağıllı" proqram sizə bütün mətnləri verəcək, mənası məşhur seriyalarla iç-içədir. Layihə U.M.N.I.K.-da qrant qazandı. ümumi məbləği 400.000 rubl!

MathOcr - düsturun tanınması (Viktor Prun)

ABBYY həyata keçirmək üçün maraqlı bir tapşırıq təklif etdi - istənilən mürəkkəbliyin riyazi düsturlarını tanıyan proqram yaratmaq. FIVT tələbələri maraqlı fopflərlə əməkdaşlıq edərək tapşırığı yerinə yetirdilər - modul həqiqətən matan və ya fizika dərsliklərindən skan edilmiş düsturları tanıyır. Nəticə: ABBYY bu məhsulu böyük pula almağa hazırdır.

MIPT ilə birgə ABC AI layihəsinin bir hissəsi olaraq, Darvin təkamülünün prinsiplərinə və qanunlarına uyğun olaraq proqramları "böyütməyə" imkan verən sözdə olanlar haqqında artıq yazmışıq. Bununla belə, süni intellektə bu cür yanaşma təbii ki, “gələcəkdən gələn qonaq” olsa da. Amma sistemlər necə süni intellekt bu gün yaratmaq? Onlar necə öyrədilir? Moskva Fizika və Texnologiya İnstitutunun alqoritmlər və proqramlaşdırma texnologiyaları kafedrasının baş müəllimi, Yandex Data Factory İstifadəçi Davranışlarının Təhlili Qrupunun rəhbəri Viktor Kantor bunu anlamağa kömək etdi.

Texnologiyanın yetkinlik dövrünü müntəzəm olaraq yeniləyən Gartner tədqiqat firmasının son hesabatına görə, bütün İT, maşın öyrənməsi bu gün gözləntilərin zirvəsindədir. Bu təəccüblü deyil: son bir neçə il ərzində maşın öyrənməsi riyaziyyatçıların və alqoritmlər nəzəriyyəsi üzrə mütəxəssislərin dar dairəsinin maraq dairəsindən çıxdı və əvvəlcə İT iş adamlarının lüğətinə, sonra isə dünyaya nüfuz etdi. adi insanların. İndi xüsusi “sehrli” neyron şəbəkələri kimi bir şey var ki, Prisma tətbiqindən istifadə edən, Shazam-dan istifadə edərək mahnı axtaran və ya DeepDream-dən keçən şəkilləri görən hər kəs bilir.

Bununla belə, texnologiyadan istifadə etmək başqa, onun necə işlədiyini başa düşmək başqa şeydir. “Kompüter ona bir ipucu versəniz öyrənə bilər” və ya “neyron şəbəkəsi rəqəmsal neyronlardan ibarətdir və insan beyni kimi qurulmuşdur” kimi ümumi sözlər kiməsə kömək edə bilər, lakin daha çox onlar vəziyyəti çaşdırırlar. Riyaziyyat öyrənməsi ilə ciddi məşğul olmaq istəyənlərin populyar mətnlərə ehtiyacı yoxdur: onlar üçün dərsliklər və əla onlayn kurslar var. Biz orta yolla getməyə çalışacağıq: öyrənmənin əslində mümkün olan ən sadə tapşırıqda necə baş verdiyini izah edin və sonra eyni yanaşmanın real maraqlı problemləri həll etmək üçün necə tətbiq oluna biləcəyini göstərin.

Maşınlar necə öyrənirlər

Başlamaq üçün, maşın öyrənməsinin necə baş verdiyini dəqiq başa düşmək üçün anlayışları müəyyən edək. Bu sahədə qabaqcıllardan biri Artur Samuel tərəfindən müəyyən edildiyi kimi, maşın öyrənməsi "kompüterlərə birbaşa proqramlaşdırılmadan öyrənməyə imkan verən" üsullara istinad edir. Maşın öyrənmə metodlarının iki geniş sinfi var: nəzarət edilən öyrənmə və nəzarətsiz öyrənmə. Birincisi, məsələn, kompüterə pişiklərin təsviri olan fotoşəkilləri axtarmağı öyrətmək lazım olduqda, ikincisi - maşına ehtiyac duyduqda, məsələn, xəbərləri müstəqil olaraq hekayələrdə qruplaşdırmaq imkanı əldə etmək üçün istifadə olunur. Yandex.News və ya Google News kimi xidmətlər. Yəni, birinci halda, düzgün cavabın mövcudluğunu nəzərdə tutan bir vəzifə ilə məşğul oluruq (şəkildəki pişik ya oradadır, ya da yoxdur), ikincidə - tək düzgün cavab yoxdur, amma var fərqli yollar problemin həlli. Ən maraqlısı kimi birinci sinif problemləri üzərində dayanacağıq.

Beləliklə, kompüterə bəzi proqnozlar verməyi öyrətməliyik. Və, tercihen, mümkün qədər dəqiq. Proqnozlar iki növ ola bilər: ya bir neçə cavab variantı arasında seçim etməlisiniz (şəkildə pişik var, ya yox - bu iki variantdan birinin seçimidir, şəkillərdəki hərfləri tanımaq qabiliyyəti birinin seçimidir bir neçə onlarla seçim və s.) və ya ədədi proqnoz verin. Məsələn, bir insanın boyuna, yaşına, ayaqqabı ölçüsünə və s. Bu iki növ problem yalnız fərqli görünür; əslində, demək olar ki, eyni şəkildə həll olunur. Necə olduğunu anlamağa çalışaq.

Proqnozlaşdırma sistemini qurmağımız lazım olan ilk şey, sözdə təlim nümunəsini, yəni əhalidəki insanların çəkisi haqqında məlumatları toplamaqdır. İkincisi, bir sıra xüsusiyyətlərə qərar verməkdir, bunun əsasında çəki haqqında nəticə çıxara bilərik. Aydındır ki, bu əlamətlərdən ən "güclü" biri bir insanın böyüməsi olacaq, buna görə də ilk yaxınlaşma olaraq yalnız onu götürmək kifayətdir. Əgər çəki boydan xətti asılıdırsa, o zaman proqnozumuz çox sadə olacaq: bir insanın çəkisi onun hündürlüyünə bəzi əmsala vurulan, üstəgəl ən sadə y \u003d kx + b düsturu ilə yazılan bəzi sabit dəyərə bərabər olacaqdır. Bir insanın çəkisini proqnozlaşdırmaq üçün bir maşın yetişdirmək üçün etməli olduğumuz tək şey k və b üçün düzgün dəyərləri tapmaqdır.

Maşın öyrənmənin gözəlliyi ondadır ki, öyrəndiyimiz asılılıq çox mürəkkəb olsa belə, yanaşmamızın özündə mahiyyətcə çox az dəyişiklik olur. Biz yenə də eyni reqressiya ilə qarşılaşacağıq.

Deyək ki, insanın boyu insanın çəkisinə xətti olaraq deyil, üçüncü dərəcədə təsir edir (bu, ümumiyyətlə gözləniləndir, çünki çəki bədən həcmindən asılıdır). Bu asılılığı nəzərə almaq üçün y=k 1 x+k 2 x 3 +b əldə edərkən tənliyimizə daha bir termini, yəni öz əmsalı ilə üçüncü artım dərəcəsini daxil edirik. İndi maşını öyrətmək üçün iki deyil, üç qiymət tapmalıyıq (k 1, k 2 və b). Deyək ki, biz də proqnozumuzda insanın ayaqqabısının ölçüsünü, yaşını, televizora baxmağa sərf etdiyi vaxtı və mənzilindən ən yaxın fastfud məntəqəsinə qədər olan məsafəni nəzərə almaq istəyirik. Problem yoxdur: biz sadəcə bu xüsusiyyətləri eyni tənliyə ayrı-ayrı şərtlər kimi qoyuruq.

Ən vacibi tələb olunan əmsalları (k 1 , k 2 , … k n) tapmaq üçün universal bir üsul yaratmaqdır. Əgər belədirsə, proqnozlaşdırmaq üçün hansı funksiyalardan istifadə edəcəyimiz bizə demək olar ki, biganə qalacaq, çünki maşın özü vacib olanlara çox, kiçik olanı isə əhəmiyyətsiz xüsusiyyətlərə verməyi öyrənəcək. Xoşbəxtlikdən, belə bir üsul artıq icad edilmişdir və demək olar ki, bütün maşın öyrənməsi uğurla işləyir: ən sadə xətti modellərdən üzün tanınması sistemlərinə və nitq analizatorlarına qədər. Bu üsul gradient eniş adlanır. Ancaq bunun necə işlədiyini izah etməzdən əvvəl kiçik bir təxribat etmək və neyron şəbəkələri haqqında danışmaq lazımdır.

Neyron şəbəkələri

2016-cı ildə neyron şəbəkələri informasiya gündəliyinə o qədər sıx daxil oldular ki, demək olar ki, istənilən maşın öyrənməsi və ümumilikdə təkmil İT ilə eyniləşdilər. Formal olaraq desək, bu doğru deyil: riyaziyyatın öyrənilməsində neyron şəbəkələr həmişə istifadə edilmir, başqa texnologiyalar da var. Ancaq ümumilikdə, əlbəttə ki, belə bir assosiasiya başa düşüləndir, çünki neyron şəbəkələrə əsaslanan sistemlər indi ən "sehrli" nəticələr verir, məsələn, bir insanı fotoşəkillə axtarmaq imkanı, məlumatları ötürən tətbiqlərin ortaya çıxması. bir təsvirin digərinə üslubu və ya müəyyən bir şəxsin nitq tərzində mətnlər yaratmaq üçün sistemlər.

Neyroşəbəkələrin necə təşkil edildiyi, biz artıq. Burada sadəcə vurğulamaq istəyirəm ki, digər maşın öyrənmə sistemləri ilə müqayisədə neyron şəbəkələrinin gücü onların çoxqatlı olmasındadır, lakin bu, onları işləmə tərzi baxımından əsaslı şəkildə fərqləndirmir. Layering həqiqətən çox mücərrəd tapmağa imkan verir ümumi xüsusiyyətlər və şəkildəki piksellər kimi kompleks xüsusiyyətlər dəstindəki asılılıqlar. Ancaq başa düşmək vacibdir ki, öyrənmə prinsipləri baxımından neyron şəbəkəsi adi xətti reqressiya düsturları dəstindən köklü şəkildə fərqlənmir, ona görə də eyni qradiyent eniş metodu burada da əla işləyir.

Neyron şəbəkənin "gücü" giriş qatının dəyərlərini birləşdirən neyronların ara qatının olmasıdır. Buna görə neyron şəbəkələri xətti və ya kvadratik əlaqə kimi sadə düsturlara endirilməsi çətin olan çox mücərrəd məlumat xüsusiyyətləri tapa bilər.

Bir misalla izah edək. Bir insanın çəkisinin boyundan və boyundan asılı olduğu bir proqnoz üzərində dayandıq, bu y=k 1 x+k 2 x 3 +b düsturu ilə ifadə edilir. Bəzi uzanma ilə, lakin əslində belə bir formul da neyron şəbəkəsi adlandırıla bilər. Adi bir neyron şəbəkəsində olduğu kimi, burada da xüsusiyyətlər təbəqəsi olan "neyronların" birinci təbəqəsi var: bunlar x və x 3 (yaxşı, bizim yadda saxladığımız və bunun üçün "tək neyron"dur) b əmsalı cavabdehdir). Üst və ya nəticələnən təbəqə tək "neyron" y, yəni insanın proqnozlaşdırılan çəkisi ilə təmsil olunur. Və "neyronların" birinci və sonuncu təbəqəsi arasında gücü və ya çəkisi k 1 , k 2 və b əmsalları ilə təyin olunan əlaqələr var. Bu "neyron şəbəkəsini" öyrətmək sadəcə olaraq eyni əmsalları tapmaq deməkdir.

Burada "real" neyron şəbəkələrindən yeganə fərq ondan ibarətdir ki, bizdə vəzifəsi giriş xüsusiyyətlərini birləşdirmək olan bir aralıq (və ya gizli) neyron təbəqəsi yoxdur. Belə təbəqələrin tətbiqi mövcud funksiyalar arasında mümkün asılılıqları icad etməyə deyil, onların neyron şəbəkədə artıq mövcud olan kombinasiyalarına etibar etməyə imkan verir. Məsələn, yaş və orta televiziya vaxtı insanın çəkisinə sinergetik təsir göstərə bilər, lakin neyron şəbəkəmiz olduğundan bunu əvvəlcədən bilmək və onların məhsulunu formulaya daxil etmək lazım deyil. Neyron şəbəkəsində mütləq hər hansı iki xüsusiyyətin təsirini birləşdirən neyron olacaq və bu təsir nümunədə həqiqətən nəzərə çarpırsa, təlimdən sonra bu neyron avtomatik olaraq böyük çəki alacaq.

gradient eniş

Beləliklə, bizdə məlum verilənlərə malik təlim nümunələri toplusu, yəni dəqiq ölçülmüş insan çəkisi olan cədvəl və bəzi asılılıq hipotezi, bu halda xətti reqressiya y=kx+b var. Bizim vəzifəmiz k və b-nin düzgün dəyərlərini əl ilə deyil, avtomatik tapmaqdır. Və tercihen, formulaya daxil olan parametrlərin sayından asılı olmayan universal bir üsul.

Bunu etmək, ümumiyyətlə, asandır. Əsas ideya cari ümumi xəta səviyyəsini ölçəcək və əmsalları “buralayacaq” funksiya yaratmaqdır ki, ümumi xəta səviyyəsi tədricən aşağı düşsün. Səhv səviyyəsini necə endirmək olar? Parametrlərimizi düzgün istiqamətə çevirməliyik.

Təsəvvür edin ki, axtardığımız iki parametrimiz, eyni k və b, müstəvidə iki istiqamət, şimal-cənub və qərb-şərq oxları kimi. Belə bir müstəvidəki hər bir nöqtə əmsalların müəyyən bir dəyərinə, boy və çəki arasında müəyyən bir xüsusi əlaqəyə uyğun olacaq. Və müstəvidəki hər bir belə nöqtə üçün, nümunəmizdəki nümunələrin hər biri üçün bu proqnozun verdiyi səhvlərin ümumi səviyyəsini hesablaya bilərik.

Təyyarədə müəyyən bir hündürlük kimi bir şey çıxır və bütün ətraf məkan dağ mənzərəsini xatırlatmağa başlayır. Dağlar səhv nisbətinin çox yüksək olduğu nöqtələr, dərələr isə daha az səhv olan yerlərdir. Aydındır ki, sistemimizi öyrətmək yerdə ən aşağı nöqtəni, səhv nisbətinin minimal olduğu nöqtəni tapmaq deməkdir.

Bu nöqtəni necə tapmaq olar? Ən çox Doğru yol- başlanğıcda bitdiyimiz nöqtədən hər zaman aşağı hərəkət edin. Beləliklə, gec-tez biz yerli minimuma - yaxın qonşuluqda heç bir şey olmayan bir nöqtəyə çatacağıq. Üstəlik, müxtəlif ölçülü addımlar atmaq məqsədəuyğundur: yamac sıldırım olduqda, daha da genişlənə bilərsiniz, yamac kiçik olduqda, yerli minimuma qədər "ayaq ucunda" qaçmaq daha yaxşıdır, əks halda sürüşə bilərsiniz.

Qradiyentin enməsi belə işləyir: biz xüsusiyyət çəkilərini xəta funksiyasında ən böyük düşmə istiqamətində dəyişirik. Biz onları iterativ şəkildə, yəni dəyəri yamacın dikliyinə mütənasib olan müəyyən bir addımla dəyişdiririk. Maraqlıdır ki, xüsusiyyətlərin sayının artması ilə (insanın boyu, yaşı, ayaqqabı ölçüsü və s. kub əlavə etməklə) əslində heç nə dəyişmir, sadəcə olaraq mənzərəmiz ikiölçülü deyil, çoxölçülü olur.

Səhv funksiyası çəkisini artıq dəqiq bildiyimiz insanlar üçün mövcud düsturun imkan verdiyi bütün kənarlaşmaların kvadratlarının cəmi kimi müəyyən edilə bilər. Gəlin bir az götürək təsadüfi dəyişənlər k və b, məsələn, 0 və 50. Onda sistem bizim üçün nümunədəki hər bir şəxsin çəkisinin həmişə 50 kiloqram olduğunu proqnozlaşdıracaq y=0×x+50 Qrafikdə belə bir asılılıq düzə bənzəyəcək. üfüqi paralel xətt. Aydındır ki, bu, çox da yaxşı proqnoz deyil. İndi bu proqnozlaşdırılan dəyərdən çəkidə sapmanı götürək, kvadratını (mənfi dəyərlər də nəzərə alınsın) və yekunlaşdıraq - bu nöqtədə səhv olacaq. Əgər təhlilin başlanğıcı ilə tanışsınızsa, o zaman hətta aydınlaşdıra bilərsiniz ki, ən böyük eniş istiqaməti k və b-yə münasibətdə xəta funksiyasının qismən törəməsi ilə verilir və addım aşağıdakılardan seçilən dəyərdir. praktik mülahizələr: kiçik addımlar hesablamaq üçün çox vaxt aparır və böyük olanlar minimumu əldən verəcəyimizə səbəb ola bilər.

Yaxşı, ancaq bir çox xüsusiyyətləri olan mürəkkəb reqressiya deyil, həqiqi neyron şəbəkəmiz varsa necə? Bu halda gradient enişini necə tətbiq edirik? Məlum oldu ki, qradiyent eniş neyron şəbəkəsi ilə eyni işləyir, yalnız təlim 1) mərhələlərlə, təbəqədən təbəqəyə və 2) nümunədəki bir nümunədən digərinə tədricən baş verir. Burada istifadə olunan metod geri yayılma adlanır və müstəqil olaraq 1974-cü ildə sovet riyaziyyatçısı Aleksandr Qaluşkin və Harvard Universitetinin riyaziyyatçısı Pol Con Webros tərəfindən təsvir edilmişdir.

Alqoritmin ciddi təqdimatı üçün intuitiv səviyyədə qismən törəmələri (məsələn, kimi) yazmaq lazım olsa da, hər şey olduqca sadədir: nümunədəki nümunələrin hər biri üçün müəyyən bir proqnozumuz var. neyron şəbəkənin çıxışı. Düzgün cavaba malik olmaqla, proqnozdan düzgün cavabı çıxara və beləliklə, xəta əldə edə bilərik (daha doğrusu, çıxış qatının hər bir neyronu üçün səhvlər toplusu). İndi bu xətanı neyronların əvvəlki təbəqəsinə ötürməliyik və bu təbəqənin bu xüsusi neyronu xətaya nə qədər çox töhfə vermişsə, onun çəkisini bir o qədər azaltmalıyıq (əslində biz yenə də qismən törəmə götürməkdən danışırıq, xəyali mənzərəmizin maksimum sıldırımı boyunca hərəkət etmək haqqında) . Bunu etdikdən sonra əks istiqamətdə, yəni neyron şəbəkəsinin çıxışından girişə doğru hərəkət edərək növbəti təbəqə üçün eyni prosedur təkrarlanmalıdır.

Təlim nümunəsinin hər bir nümunəsi ilə bu şəkildə neyron şəbəkəsindən keçərək və neyronların ağırlıqlarını düzgün istiqamətə "buraraq" nəhayət təlim keçmiş neyron şəbəkəsi əldə etməliyik. Geri yayılma metodu çoxqatlı neyron şəbəkələri üçün gradient eniş metodunun sadə modifikasiyasıdır və buna görə də istənilən mürəkkəblikdə olan neyron şəbəkələri üçün işləməlidir. Burada “olmalıdır” deyirik, çünki əslində gradient enişinin uğursuz olduğu və yaxşı reqressiya etməyə və ya neyron şəbəkəsini məşq etməyə imkan verməyən hallar var. Belə çətinliklərin nədən qaynaqlandığını bilmək faydalıdır.

Qradient eniş çətinlikləri

Mütləq minimumun səhv seçimi. Qradiyent enmə üsulu yerli ekstremumu tapmağa kömək edir. Lakin biz həmişə funksiyanın mütləq qlobal minimum və ya maksimumuna çatmaq üçün istifadə edə bilmirik. Bu ona görə baş verir ki, antiqradiyent boyunca hərəkət edərkən biz qarşılaşdığımız ilk yerli minimuma çatdığımız anda dayanırıq və alqoritm öz işini dayandırır.

Təsəvvür edin ki, bir dağın başında dayanırsınız. Əgər ərazidə ən aşağı səthə enmək istəyirsinizsə, qradiyent enmə üsulu həmişə sizə kömək etməyəcək, çünki yolunuzdakı ilk aşağı nöqtə mütləq ən aşağı nöqtə deyil. Əgər həyatda bir az yuxarı qalxmağa dəyər olduğunu görsən və daha da aşağı enə bilsən, onda alqoritm belə bir vəziyyətdə sadəcə dayanacaq. Çox vaxt bu vəziyyətdən düzgün addım seçməklə qarşısını almaq olar.

Səhv addım seçimi. Qradiyent enmə üsulu iterativ bir üsuldur. Yəni addım ölçüsünü - endiyimiz sürəti özümüz seçməliyik. Çox böyük bir addım seçməklə, ehtiyac duyduğumuz ekstremumu keçə bilərik və minimumu tapa bilmərik. Bu, çox kəskin enişlə üzləşdiyiniz halda baş verə bilər. Və çox kiçik bir addım seçmək alqoritmin olduqca ləng işləməsi ilə təhdid edir, əgər özümüzü nisbi bir vəziyyətdə tapırıqsa. hamar səth. Bir daha sıldırım bir dağın başında olduğumuzu təsəvvür etsək, o zaman minimuma yaxın çox dik eniş səbəbindən sadəcə onun üzərindən uçacağımız bir vəziyyət yarana bilər.

Şəbəkə iflici. Bəzən elə olur ki, gradient eniş metodu ümumiyyətlə minimumu tapa bilmir. Bu, minimumun hər iki tərəfində hətta sahələr olduqda baş verə bilər - alqoritm düz bir sahəyə vuraraq addımı azaldır və nəticədə dayanır. Əgər dağın zirvəsində dayanaraq, düzənlikdəki evinizə doğru hərəkət etmək qərarına gəlsəniz, təsadüfən çox düz bir əraziyə girsəniz, yol çox uzun ola bilər. Və ya düz sahələrin kənarlarında praktiki olaraq dik "yamaclar" varsa, alqoritm çox böyük bir addım seçərək, praktik olaraq minimuma keçmədən bir yamacdan digərinə tullanır.

Maşın öyrənmə sistemini tərtib edərkən bütün bu mürəkkəb məqamlar nəzərə alınmalıdır. Məsələn, səhv funksiyasının zamanla necə dəyişdiyini dəqiq izləmək həmişə faydalıdır - hər yeni dövrə ilə düşür və ya vaxtı qeyd edir, addım ölçüsünün dəyişməsindən asılı olaraq bu enişin xarakteri necə dəyişir. Pis yerli minimuma çatmamaq üçün landşaftın müxtəlif təsadüfi seçilmiş nöqtələrindən başlamaq faydalı ola bilər - onda ilişib qalma ehtimalı xeyli aşağıdır. Qradiyent enmə ilə məşğul olmağın daha çox böyük və kiçik sirləri var və qradiyent enmə ilə az oxşarlığı olan daha ekzotik öyrənmə yolları var. Bununla belə, bu, artıq başqa bir söhbət üçün mövzu və AI ABC layihəsi çərçivəsində ayrıca məqalədir.

Aleksandr Erşov tərəfindən hazırlanmışdır