منزل، تصميم، إصلاح، ديكور. الفناء والحديقة. افعلها بنفسك

منزل، تصميم، إصلاح، ديكور. الفناء والحديقة. افعلها بنفسك

» "عالم البيانات بارد يتلقى كمدير عام للشركة المركزية". خبير في تعلم الجهاز ياندكس. تاكسي - حول كيفية التنبؤ بالبيانات المستقبل وتشكيل العالم

"عالم البيانات بارد يتلقى كمدير عام للشركة المركزية". خبير في تعلم الجهاز ياندكس. تاكسي - حول كيفية التنبؤ بالبيانات المستقبل وتشكيل العالم

كجزء من مشروع ABC ABC المشترك، قد كتبنا بالفعل عن البرامج المزعومة التي تسمح ببرامج "لتنمو" على مبادئ وقوانين التطور الدارويني. ومع ذلك، حتى الآن هذا النهج في الذكاء الاصطناعي هو بالتأكيد "ضيف من المستقبل". ولكن كيف يتم إنشاء أنظمة الاستخبارات الاصطناعية اليوم؟ كيف يتم تدريسها؟ في هذا، Viktor Kantor، محاضر أقدم من قسم الخوارزميات والتكنولوجيات والتقنيات لبرمجة MFTI، رئيس مجموعة تحليل سلوك المستخدم لشركة Yandex Data Factory.

وفقا للتقرير الأخير لشركة الأبحاث Gartner، والتي تقوم بتحديث بانتظام "حلقة تقنيات الاستحقاق"، اليوم من كل ما في ذروة التوقعات هي تعلم الآلة بالضبط. ليس من المستغرب: على مدار السنوات القليلة الماضية، خرجت التعلم الآلي من مجال مصلحة الدائرة الضيقة من علماء الرياضيات والمتخصصين في نظرية الخوارزميات واخترقها أولا في قاموس رجال الأعمال، ثم في العالم الناس العاديين. الآن بعد أن هناك شيء مثل الشبكة العصبية مع "سحر" خاص بهم يعرف أي شخص يستخدم تطبيق Prisma، تبحث عن أغاني مع Shazam أو رأيت الصور التي مرت عبر deepdream.

ومع ذلك، هناك شيء واحد هو استخدام التكنولوجيا، والآخر هو فهم كيفية عمله. الكلمات الشائعة مثل "الكمبيوتر يمكن أن يتعلم ما إذا كان يعطي تلميحا" أو "neuraleta يتكون من الخلايا العصبية الرقمية وترتيبها مثل الدماغ البشري" قد يساعد شخص ما أيضا، ولكن في كثير من الأحيان تخلط بين الوضع فقط. نفس الشخص الذي سيشارك بجدية في حصانة، لا يلزم أن تكون النصوص الشعبية: هناك كتب مدرسية ودورات ممتازة عبر الإنترنت لهم. سنحاول المرور بالطريقة الوسطى: لشرح كيف تعلمت بالفعل في مهمة أكثر بسيطة، ثم أظهر كيف يمكن تطبيق نفس النهج لحل المشاكل الحقيقية المثيرة للاهتمام.

كيفية تعلم السيارات

لتبدأ، من أجل التعامل مع كيفية حدوث تعلم الآلة، سنتحدد مع المفاهيم. من خلال تحديد أحد رواد هذه المنطقة، يتضمن Arthur Samuel، التعلم الآلي الأساليب التي "السماح لأجهزة الكمبيوتر بالتعلم دون برامج مباشرة". هناك فئة واسعة من أساليب التعلم الآلي: التدريب مع المعلم والتدريب دون معلم. يستخدم الأول عندما نكون، على سبيل المثال، تحتاج إلى تعليم جهاز كمبيوتر للبحث عن الصور مع صورة الماشية، والثاني - عندما نحتاج إلى جعل السيارة، على سبيل المثال، يمكن أن أخبار المجموعة بشكل مستقل في المؤامرات، كما يحدث ذلك في خدمات مثل Yandex.news أو أخبار Google. وهذا هو، في الحالة الأولى، نحن نتعامل مع المهمة التي تنطوي على وجود الإجابة الصحيحة (قطة في الصورة أم لا، أم لا)، في الثانية - لا توجد إجابة صحيحة فقط، ولكن هناك طرق مختلفة لحل المشكلة. سنركز على الدرجة الأولى من المهام باعتبارها الأكثر إثارة للاهتمام.

لذلك، نحن بحاجة إلى تعليم الكمبيوتر للقيام ببعض التنبؤات. علاوة على ذلك، فمن المرغوب فيه أكثر دقة. يمكن أن تكون التنبؤات من نوعين: إما أن تحتاج إلى الاختيار بين العديد من الإجابات (هناك قطة على لقطة أم لا - فهذا هو اختيار إصدار واحد من اثنين، والقدرة على التعرف على الحروف على الصور هو اختيار خيار واحد من عدة عشرات وما إلى ذلك)، أو تقديم التنبؤ العددي. على سبيل المثال، للتنبؤ بوزن الشخص على أساس نموه وعمره وحجم الأحذية وما إلى ذلك. يبدو نوعان من هذه المهام فقط على عكس، في الواقع يتم حلها بنفس القدر تقريبا. دعونا نحاول أن نفهم بالضبط كيف.

أول شيء نحتاجه إلى جعل نظام التنبؤ هو جمع عينة التعلم المزعومة، أي البيانات المتعلقة بوزن الأشخاص في السكان. والثاني هو اتخاذ قرار بشأن مجموعة العلامات، على أساس ما يمكننا رسم استنتاجات حول الوزن. من الواضح أن واحدة من أكثر العلامات "القوية" ستكون نمو بشري، لذلك في التقريب الأول يكفي أن تأخذ فقط ذلك. إذا كان الوزن يعتمد على النمو الخطي، فسيكون تنبؤنا بسيطا للغاية: سيكون وزن الشخص مساويا لنموه مضروبا من قبل نوع من المعاملات، بالإضافة إلى نوع من القيمة الثابتة، والذي يتم كتابته بواسطة أبسط صيغة Y \u003d kx + ب. كل ما نحتاج إليه هو تعليم السيارة بالتنبؤ بوزن الشخص، فهو بطريقة أو بأخرى العثور على القيم المناسبة ل K و B.

سحر التعلم الآلي هو أنه حتى لو كان الاعتماد الذي ندرسه معقدة للغاية، في نهجنا للغاية، لن يتغير شيء تقريبا. سوف نستمر في التعامل مع نفس الانحدار.

لنفترض أن نموها ليس خطرا على الوزن البشري، وفي الدرجة الثالثة (التي توقعت بالفعل، لأن الوزن يعتمد على حجم الجسم). أن نأخذ في الاعتبار هذا الاعتماد، نحن ببساطة إحضار عضو آخر في معادلةنا، أي الدرجة الثالثة من النمو مع معاملها الخاص، بينما Y \u003d K 1 X + K 2 × 3 + B. الآن، لتدريب السيارة، سنحتاج إلى العثور على ليس اثنين، ولكن ثلاثة كميات (K 1، K 2 و B). لنفترض أننا نريد في تنبؤنا أن يأخذ في الاعتبار حجم أحذية الشخص، وعمره، والوقت الذي يقضيه التلفزيون مع التلفزيون، والمسافة من شقته إلى أقرب نقطة فود سريعة. لا توجد مشاكل: نحن ببساطة نجعل هذه العلامات كأعضاء منفصلين في نفس المعادلة.

الشيء الأكثر أهمية هو إنشاء طريقة عالمية للعثور على المعاملات المطلوبة (K 1، K 2، ... K N). إذا كان كذلك، فسيكون من غير مبالا تقريبا بما يجب استخدام علامات للتنبؤ به، لأن السيارة نفسها ستعلم إرفاق علامات مهمة كبيرة، وصغيرة غير مهمة. لحسن الحظ، تم اختراع هذه الطريقة بالفعل وتعلم جميع الآلات تقريبا بنجاح يعمل بنجاح: من أبسط الطرز الخطية إلى أنظمة التعرف على الأشخاص ومحللات الكلام. وتسمى هذه الطريقة نزول التدرج. ولكن قبل شرح كيفية عمله، من الضروري أن تتراجع قليلا وإخبار الشبكة العصبية.

neuraseti.

في عام 2016، كانت الشبكة العصبية مدرجة بإحكام شديدة في جدول أعمال المعلومات التي تم تحديدها تقريبا مع أي تعلم الآلات وتقدمها على الإطلاق. التحدث رسميا، فمن غير الصحيح: الشبكات العصبية في خمر لا تستخدم دائما، وهناك أيضا تكنولوجيات أخرى. ولكن بشكل عام، بطبيعة الحال، مثل هذه الجمعية مفهومة، لأن النظام على وجه التحديد يعتمد النظام على الشبكات العصبية الآن أكثر النتائج "السحرية" مثل إمكانية البحث عن شخص من التصوير الفوتوغرافي، ومظهر التطبيقات التي تحمل أسلوب صورة واحدة لآخر، أو أنظمة توليد النظام في طريقة الكلام لشخص معين.

يتم ترتيب الطريق للعلاج العصبي، نحن بالفعل. هنا أريد فقط التأكيد على أن قوة الشبكة العصبية مقارنة بأنظمة تعلم الآلات الأخرى قد اختتمت في الطبقات المتعددة، ولكن هذا لا يجعلها شيئا ممتازا بشكل أساسي من طريقة العمل. تسمح لك الطبقات المتعددة حقا بالعثور على ميزات وتبعية مشتركة مجردة للغاية في مجموعات معقدة من العلامات، مثل البكسل في الصورة. ولكن من المهم أن نفهم أنه من وجهة نظر مبادئ التعلم إلى Neurallet، لا يختلف أي شيء جذريا عن مجموعة صيغ الانحدار الخطي التقليدي، وبالتالي فإن نفس طريقة نزول التدرج يعمل تماما هنا.

"قوة" الشبكة العصبية موجودة في وجود طبقة متوسطة من الخلايا العصبية، والتي تلخيص الجمع بين قيم طبقة الإدخال. بسبب هذا النوراليو، قد تكون هناك ميزات مجردة للغاية من البيانات التي يصعب تقليل الصيغ البسيطة مثل الاعتماد الخطي أو التربيعي.

دعونا نوضح على المثال. توقفنا عن التنبؤ الذي يعتمد فيه الوزن البشري على نموه ونموه في كوبا، والتي تعبر عنها من قبل الصيغة Y \u003d K 1 X + K 2 × 3 + B. مع بعض الإمتداد، ولكن في الواقع، حتى مثل هذه الصيغة يمكن أن يسمى الشبكة العصبية. فيه، كما هو الحال في الشبكة العصبية المعتادة، هناك الطبقة الأولى من "الخلايا العصبية"، إنها طبقة من العلامات: إنها X و X 3 (حسنا، "عصابة واحدة"، والتي نضعها في الاعتبار والتي تتوافق معها إلى معامل ب). الجزء العلوي أو الناتجة، يتم تمثيل الطبقة من قبل واحد "الخلايا العصبية" Y، وهذا هو، الوزن المتوقع للرجل. وبين الطبقة الأولى والأخيرة من "الخلايا العصبية" هناك اتصالات، يتم تحديد الطاقة أو الوزن منها من قبل المعاملات K 1، K 2 و B. لتعليم هذه "Neurallet" تعني فقط العثور على هذه المعاملات للغاية.

الفرق الوحيد من الشبكات العصبية "الحقيقية" هنا هو أنه ليس لدينا طبقة متعددة (أو مخفية) من الخلايا العصبية التي تتمثل مهمتها في الجمع بين علامات الإدخال. يسمح إدخال هذه الطبقات بعدم اختراع التبعيات المحتملة بين العلامات بين العلامات المتاحة، ولكنها تعتمد على مجموعاتها الحالية بالفعل في الشبكة العصبية. على سبيل المثال، يمكن أن يكون لدى العمر ومتوسط \u200b\u200bالوقت أمام التلفزيون تأثير تآزري على الوزن البشري، ولكن وجود شبكة عصبية، ونحن لسنا ملزمين بمعرفته مقدما وجعل عملهم في الصيغة. في العصبية، سيكون هناك خلاص عصبي، الذي يجمع بين تأثير أي علامات، وإذا كان هذا التأثير ملحوظا حقا في العينة، بعد التدريب، فإن هذا الخلايا العصبي سيتلقى تلقائيا الكثير من الوزن.

نزول التدرج

لذلك، لدينا عينة تدريبية من الأمثلة مع البيانات المعروفة، أي طاولة ذات وزن بشري يقاس بدقة، وبعض الفرضية للاعتماد، في هذه الحالة إن الانحدار الخطي Y \u003d KX + B. مهمتنا هي العثور على القيم الصحيحة K و B، وليس يدويا، ولكن تلقائيا. ويفضل أن تكون طريقة عالمية، لا تعتمد على عدد المعلمات المضمنة في الصيغة.

جعله، بشكل عام، سهل. تتمثل الفكرة الرئيسية في إنشاء وظيفة معينة من شأنها قياس الخطأ الإجمالي الحالي و "تطور" المعاملات بحيث يسقط مستوى الخطأ الإجمالي تدريجيا. كيفية جعل مستوى الخطأ يسقط؟ تحتاج إلى تحريف المعلمات لدينا في الجانب المطلوب.

قدم اثنان من المعلمات التي نبحث عنها، وهي نفس K و B، كموقعين على متن الطائرة، مثل المحاور الشمالية والجنوبية والغرب الشرقي. ستتوافق كل نقطة على هذه الطائرة مع قيمة معينة من المعاملات، وهي علاقة محددة معينة بين الارتفاع والوزن. ولكل نقطة من هذا القبيل على متن الطائرة، من الممكن حساب مستوى الأخطاء الإجمالية، والتي تمنحها تنبؤا في كل من الأمثلة في عيناتنا.

اتضح شيئا مثل ارتفاع معين على متن الطائرة، وتبدأ جميع الفضاء المحيطي في تشبه المناظر الطبيعية الجبلية. الجبال هي نقاط حيث مستوى الأخطاء مرتفعة للغاية، والوديان هي الأماكن التي توجد فيها أخطاء أقل. من الواضح أن لتعليم نظامنا يعني العثور على أدنى نقطة على الأرض، حيث النقطة التي يكون فيها مستوى الخطأ ضئيلا.

كيف يمكنني العثور على هذه النقطة؟ الطريقة الصحيحة هي التحرك طوال الوقت لأسفل من النقطة التي وجدناها في البداية. عاجلا أم آجلا سنأتي إلى الحد الأدنى المحلي - النقطة الواردة أدناه التي لا يوجد شيء في الحي القريب. علاوة على ذلك، من المستحسن اتخاذ خطوات من أحجام مختلفة: عندما يكون المنحدر باردا، يمكنك المشي أوسع عندما يكون المنحدر صغيرا، فمن الأفضل أن تتسلل إلى الحد الأدنى المحلي "على Tiptoe"، وإلا يمكنك أيضا الانزلاق أيضا.

هذه هي الطريقة التي تعمل بها طريقة نسب التدرج: نحن نغير أوزان العلامات في اتجاه أعظم انخفاض في وظيفة الخطأ. نحن نغير بهم تكرارا، وهذا هو، مع خطوة معينة، القيمة التي تتناسب مع منحدر المنحدر. ما هو مثير للاهتمام، بزيادة عدد العلامات (إضافة مكعب نمو الشخص، وعمرها، وحجم الأحذية، وهلم جرا) في الواقع، لا شيء يتغير، ببساطة يصبح مشهدنا ليس ثنائي الأبعاد، لكن متعدد الأبعاد.

يمكن تعريف وظيفة الخطأ على أنها مجموع المربعات من جميع الانحرافات التي تعترف الصيغة الحالية فيما يتعلق بالأشخاص الذين يعرف وزنهم بالفعل. خذ بعض المتغيرات العشوائية K و B، على سبيل المثال 0 و 50. ثم سيتنبينا النظام أن وزن كل شخص في العينة هو دائما 50 كيلوغراما Y \u003d 0 × x + 50 على الرسم البياني، مثل هذه التبعية تبدو وكأنها مستقيم، مواز أفقي. من الواضح أن هذا ليس تنبؤا جيدا. الآن نحن نتخذ انحرافا في وزن هذه القيمة المتوقعة، قم بإقامةه في المربع (بحيث تؤخذ القيم السلبية أيضا في الاعتبار أيضا) وتلخيصها - سيكون هذا خطأ في هذه المرحلة. إذا كنت مألوفا في بداية التحليل، فيمكنك توضيح أن اتجاه أكبر سقوط يتم تقديمه بواسطة المشتق الخاص من وظيفة الخطأ بواسطة K و B، والخطوة هي القيمة المحددة من الاعتبارات العملية: صغيرة الخطوات التي تحتل الكثير من الوقت على العمليات الحسابية، ويمكن أن تؤدي كبيرة إلى حقيقة أننا نستغرق الحد الأدنى.

حسنا، وإذا نحن لسنا انحدار معقد فقط مع الكثير من العلامات، ولكن شبكة عصبية حقيقية؟ كيف نطبق نزول التدرج في هذه الحالة؟ اتضح أنه مع الشبكة العصبية، تعمل نزول التدرج بنفس الطريقة، يحدث التدريب فقط 1) في المراحل، من الطبقة إلى الطبقة و 2) تدريجيا، من مثال واحد في العينة إلى أخرى. تسمى الطريقة التي يتم تطبيقها هنا خوارزمية عكسية خطأ، تم وصفها بشكل مستقل في عام 1974 من قبل الرياضيات السوفيتية ألكسندر غالوشيكينا والرياضيات من جامعة هارفارد بول جون ويبروس.

على الرغم من أنه من أجل عرض صارم للخوارزمية، فسيكون من الضروري شطب المشتقات الخاصة (كما، على سبيل المثال،)، على مستوى كل شيء بسيط للغاية: لكل مثال في العينة، لدينا بعض التنبؤ في إخراج الشبكة العصبية. وجود الإجابة الصحيحة، يمكننا خصم الإجابة الصحيحة من التنبؤ، وبالتالي، خطأ (أكثر بدقة مجموعة من الأخطاء في كل طبقة الإخراج العصبية). الآن نحتاج إلى تحويل هذا الخطأ إلى الطبقة السابقة من الخلايا العصبية، وكلما كان هذا الخلايا العصبية الخرسانية هذه من هذه الطبقة ساهمت في الخطأ، كلما كنا نحتاج إلى تقليل وزنها (في الواقع، فإن الخطاب يأتي مرة أخرى لاتخاذ مشتق خاص، حول الحركة بأقصى قدر من مشهدنا الوهمي). عندما فعلنا، يجب تكرار نفس الإجراء للطبقة التالية، تتحرك في الاتجاه المعاكس، أي من منفذ الشبكة العصبية إلى المدخل.

وبالتالي، وبالتالي neurallet مع كل مثال على عينة التدريب و "التواء" الأوزان من الخلايا العصبية في الاتجاه الصحيح، فعلينا في النهاية أن تتدرب على العصبي. تعد طريقة توزيع الأخطاء العكسية تعديلا بسيطا لطريقة نزول التدرج للشبكات العصبية متعددة الطبقات، وبالتالي يجب أن تعمل للشبكات العصبية لأي تعقيد. نقول هنا "يجب أن"، لأن هناك في الواقع هناك حالات عندما تمنح نزول التدرج إخفاقات ولا تسمح لك بإجراء الانحدار الجيد أو تعليمه على Neurollet. حول حقيقة أن هذه الصعوبات تنشأ، من المفيد معرفة ذلك.

صعوبات في نزول التدرج

اختيار خاطئ من الحد الأدنى المطلق. تساعد طريقة هبوط التدرج في البحث عن متطرف محلي. لكننا لسنا دائما مع ذلك، يمكننا تحقيق الحد الأدنى العالمي أو الحد الأدنى للمطلق. هذا لأنه عند الانتقال إلى مكافحة التحجيم، نتوقف في الوقت الحالي عندما نحقق أول أدنى محلي يلبي الولايات المتحدة، وتوقف الخوارزمية عملها.

تخيل أنك تقف في الجزء العلوي من الجبل. إذا كنت ترغب في النزول إلى أدنى سطح في المنطقة، فلن تتمكن طريقة هبوط التدرج دائما من مساعدتك، لأن أول أدار على طريقك لن يكون بالضرورة أقل نقطة. وإذا كنت في الحياة، فأنت تستطيع أن ترى أن هناك قليلا تسلق ويمكنك الخروج بعد ذلك، ثم تتوقف الخوارزمية في مثل هذا الموقف. في كثير من الأحيان يمكن تجنب هذا الموقف إذا اخترت الخطوة الصحيحة.

خطوات غير صحيحة. طريقة نزول التدرج هي الطريقة التكرارية. وهذا هو، نحن نحتاج أنفسنا لاختيار خطوة الخطوة - السرعة التي ننزل بها. عن طريق اختيار الكثير من الخطوة، يمكننا أن نطير بواسطة extrtum نحن بحاجة ولا نجد الحد الأدنى. يمكن أن يحدث هذا إذا وجدت نفسك أمام نزول حاد للغاية. واختيار الخطوة الصغيرة جدا يهدد عمل بطيء للغاية للخوارزمية، إذا وجدنا أنفسنا على سطح أملس نسبيا. إذا تتخيل مرة أخرى أننا في قمة الجبل الهائل، فقد يكون هناك موقف عندما، بسبب نزول رائع للغاية، نضعه ببساطة.

شلل الشبكة.في بعض الأحيان يحدث أن طريقة هبوط التدرج لا تمكن من العثور على الحد الأدنى. قد يحدث هذا إذا كان من جانبين من الحد الأدنى، ستكون هناك مناطق ناعمة - الخوارزمية، وتضرب المؤامرة المسطحة، ويقلل من الخطوة والتوقف مع مرور الوقت. إذا، وتقف على الجزء العلوي من الجبل، قررت أن تنتقل إلى منزلك في الأراضي المنخفضة، فقد يكون الطريق طويلا جدا إذا انتزعت عن طريق الخطأ منطقة ناعمة للغاية. أو، إذا كانت هناك "منحدرات" مخللة عمليا، فإن الخوارزمية، من خلال اختيار خطوة كبيرة للغاية، سيقفز من ميل واحد إلى آخر، تقريبا دون الانتقال إلى الحد الأدنى.

يجب أن تؤخذ هذه اللحظات الصعبة في الاعتبار عند تصميم نظام تعلم الجهاز. على سبيل المثال، من المفيد دائما أن تتبع بالضبط كيفية تغيير وظيفة الخطأ مع مرور الوقت - سواء كان يسقط مع كل دورة جديدة أو تدوس على الفور، حيث يتغير حرف هذا الخريف اعتمادا على التغيير في قيمة الخطوة. لتجنب الدخول إلى حد أدنى محلي سيء، من المفيد أن تبدأ من مختلف النقاط المختارة بشكل عشوائي في المناظر الطبيعية - ثم احتمالية التعثر أقل بكثير. لا يزال هناك العديد من الأسرار الكبيرة والصغيرة من الدورة الدموية مع نزول التدرج، وهناك طرق أكثر غرابة للتعلم، مما يشبه ضعف نزول التدرج. ومع ذلك، فإن هذا هو بالفعل موضوع محادثة أخرى ومقال منفصل في إطار مشروع ABC ABC.

أعدت الكسندر إرسشوف

- هل يمكن أن تخبرنا بمثال بدائي تماما، كيف يعمل جهاز الجهاز؟

تستطيع. هناك مثال على طريقة تعلم الجهاز يسمى "الشجرة الحاسمة"، واحدة من أقدم الأشياء. دعونا نفعل الآن. لنفترض أن شخص مجردة يدعوك في موعد. ما المهم بالنسبة لك؟

- أولا، أعرف ذلك أم لا ...

(فيكتور يكتبه على السبورة.)

... إذا كنت لا أعرف، فأنت بحاجة إلى الإجابة على السؤال، فهي جذابة أم لا.

وإذا كنت تعرف، لا يهم؟ يبدو أنني فهمت أنه فرع من frithsons! بشكل عام، أكتب إليك إذا كنت لا تعرف ولا غير جذابة، الإجابة "نعم لا، ربما". إذا كنت تعرف - الإجابة "نعم".

- إذا كنت أعرف، فمن المهم أيضا!

لا، سيكون فرع فرنسي.

حسنا، ثم دعونا نشير هنا، مثيرة للاهتمام أم لا. ومع ذلك، عندما لا تعرف شخصا، فإن أول رد فعل على المظهر، مع أصدقاء ننظر بالفعل إلى ما يفكر فيه وكيف.

دعونا نفعل ذلك بشكل مختلف. طموح هو أم لا. إذا كان طموحا، فسيكون من الصعب الفروليين، سيريد المزيد. وسوف تعاني النيووسيتوس.

(Victor يدفع الشجرة الحاسمة.)

مستعد. الآن يمكنك التنبؤ، مع ما جاءته على الأرجح في التاريخ. بالمناسبة، تتوقع بعض خدمات المواعدة هذه الأشياء. من خلال القياس، يمكنك التنبؤ وعدد المنتجات بشراء العملاء، وأين سيكون الناس في هذا الوقت من اليوم.

قد لا تكون الإجابات "نعم" و "لا" فقط، ولكن أيضا في شكل أرقام. إذا كنت تريد توقعات أكثر دقة، فيمكنك أن تجعل العديد من هذه الأشجار ومتوسطها عليها. وبمساعدة هذه الأشياء البسيطة، يمكنك بالفعل التنبؤ بالمستقبل.

والآن تخيل، هل كان من الصعب التوصل إلى هذا المخطط للناس قبل مائتي عام؟ بالطبع لا! هذا المخطط لا يحمل أي أنقاض خطايا في حد ذاته. كظاهرة، يوجد التعلم الآلي حوالي نصف قرن. توقعات على أساس البيانات بدأت رونالد فيشر حتى في بداية القرن العشرين. أخذ القززات وتوزيعهم على طول طول وعرض الكأس والبلة، وفقا لهذه المعايير حدد نوع النبات.

في هذه الصناعة، بدأت التعلم الآلي في استخدام العقود الماضية بشكل فعال: آلات قوية وغير مكلفة نسبيا والتي تحتاج إلى التعامل مع كمية كبيرة من البيانات، على سبيل المثال، لم تظهر هذه الأشجار الحاسمة منذ وقت طويل. لكن لا يزال الروح يلتقط: نرسم هذه القطع لكل مهمة ومساعدتهم على التنبؤ بالمستقبل.

- حسنا، بالتأكيد ليست أفضل من أي شرط الأخطبوط من مباريات كرة القدم ...

لا، حسنا، حيث نحن على ما يصل إلى الأخطبوط. على الرغم من أن لدينا المزيد من التقلبات. الآن، بمساعدة تعلم الجهاز، يمكنك توفير الوقت والمال وتحسين راحة الحياة. تدريب الجهاز قبل عدة سنوات كسر الشخص في مسألة تصنيف الصور. على سبيل المثال، يمكن للكمبيوتر التعرف على 20 صخور من الكلاب، والشخص العادي ليس كذلك.

- ومتى تحلل المستخدمين، كل شخص لك هو مجموعة من الأرقام؟

التحدث تقريبا، نعم. عندما نعمل مع البيانات، تصف جميع الكائنات، بما في ذلك سلوك المستخدم، مجموعة معينة من الأرقام. وتعكس هذه الأرقام خصوصيات سلوك الأشخاص: كم عدد المرات التي يذهبون إليها إلى سيارة أجرة، ما هي الفئة التي تستخدم سيارة أجرة، والتي تذهب عادة عادة.

الآن نحن نبني بنشاط نموذج مظهر على حد سواء لتحديد مجموعات من الأشخاص ذوي السلوك مماثل. عندما نقدم خدمة جديدة أو ترغب في نشر القديم، نقدمها لأولئك الذين سيكونون مهتمين.

على سبيل المثال، هنا لدينا خدمة - كراسي طفلين في سيارة أجرة. يمكننا أن نتعلم هذه الأخبار جميعا، ويمكننا معالجة دائرة معينة فقط من الناس. في السنة التي تراكمت فيها عدد المستخدمين الذين كتبوا في التعليقات التي يحتاجون إليها كراسي أطفال. وجدناهم ومشابه لهم. مشروط، هؤلاء الناس لمدة 30 عاما الذين يسافرون بانتظام وحب المأكولات المتوسطية. على الرغم من ذلك، بالطبع، فإن العلامات أكثر بكثير، فهي على سبيل المثال.

- حتى مثل هذه الدقيقة؟

هذه مسألة بسيطة. يتم احتساب كل شيء باستخدام استعلامات البحث.

وفي التطبيق يمكن أن تعمل بطريقة أو بأخرى؟ على سبيل المثال، أنت تعرف أنني متسول وموقع للمجموعات مثل "كيفية البقاء على قيد الحياة 500 روبل في الشهر" - أنا عرضت على السيارات الرخيصة فقط، مشترك في أخبار SpaceX - ولدي الوقت من وقت لآخر؟

يمكن أن تعمل ذلك، ولكن لم تتم الموافقة على هذه الأشياء في ياندكس، لأنها تميز. عندما تقوم بتسهيل الخدمة، من الأفضل أن تقدم ليس الأكثر قبولا، ولكن أفضل ما يعجبه الشخص. وتوزيع المنطق "هذا يتطلب آلة أفضل، وهذا أقل جيدة" - الشر.


لدى الجميع رغبات بروفيل، وأحيانا تحتاج إلى العثور على وصفة طبق من غير المتوسط، ولكن على سبيل المثال، صور حول كوبووفيليا. التخصيص وفي هذه الحالة سوف تعمل؟

هناك دائما وضع خاص.

إذا كنت لا أريد أن يعرف شخص ما عن اهتماماتي أو دعنا نقول لي وأراد أن يرى بعض القمامة، فمن الأفضل استخدام نظام التخفي.

لا يزال بإمكانك تحديد الشركة التي يجب استخدامها، على سبيل المثال، ياندكس أو جوجل.

- هناك فرق؟

سؤال صعب. أنا لا أعرف كيف الآخرين، ولكن في ياندكس، من الصعب حماية البيانات الشخصية. السيطرة خاصة الموظفين.

- وهذا هو، إذا انفصلت عن رجل، لا أستطيع معرفة ما إذا ذهب إلى هذا المنزل الريفي أم لا؟

حتى لو كنت تعمل في ياندكس. هذا، بالطبع، حزين، ولكن نعم، لن يكون من الممكن معرفة ذلك. معظم الموظفين ليس لديهم حتى الوصول إلى هذه البيانات. كل شيء مشفر. كل شيء بسيط: لا يمكنك التجسس للناس، هذه معلومات شخصية.

بالمناسبة، حول موضوع الفصل مع اللاعبين لدينا حالة مثيرة للاهتمام. عندما فعلنا التنبؤ بالنقطة "B" - نقاط الوجهة في سيارة أجرة، قدمت نصائح. نظرة.

(فيكتور يدخل التطبيق "Yandex.taxi".)

على سبيل المثال، تفكر سيارة أجرة في أنني في المنزل. يدعو لي أن أذهب إلى العمل أو رودن (قرأت هناك محاضرات في إطار تعدين البيانات التدريبية في إطار البيانات في العمل). وفي مرحلة ما، أعمل هذه المطالبات، أدركنا أنك بحاجة إلى عدم تنازل عن المستخدم. النقاط "ب" شخص ما يمكن أن يرى. لهذه الأسباب، رفضنا تقديم أماكن لتبدو وكأنها. ثم تجلس في مكان لائق مع أشخاص لائقين، فأنت تطلب سيارة أجرة، وكتابة إليك: "انظر، أنت لم تكن في هذا الشريط!"

- أي نوع من فلاش النقاط الزرقاء على خريطتك؟

هذه نقاط الالتقاط. تظهر هذه النقاط، أكثر ملاءمة لاستدعاء سيارة أجرة. بعد كل شيء، يمكنك الاتصال بهذا المكان الذي سيكون فيه غير مريح تماما للاتصال به. ولكن بشكل عام، يمكنك الاتصال في أي مكان.

- نعم، أي. طار بطريقة أو بأخرى مع هذا لمدة أسبوعين.

في الآونة الأخيرة كانت هناك صعوبات مختلفة مع GPS، أدت إلى مواقف ممتعة مختلفة. الناس، على سبيل المثال، على TVerskaya، التنقل عبر المحيط الهادئ. كما ترون، في بعض الأحيان هناك يخطئ وأكثر من أرباع.

- وإذا قمت بإعادة تشغيل التطبيق والكن مرة أخرى، فإن السعر يختلف بعض الروبل. لماذا ا؟

إذا تجاوز الطلب على الاقتراح، فإن الخوارزمية تقوم تلقائيا بإنشاء زيادة في المعامل - فهي تساعد في الاستفادة من سيارة الأجرة لأولئك المهمين للذهاب قدر الإمكان، حتى خلال فترات عالية الطلب. بالمناسبة، يمكن التنبؤ باستخدام التعلم الآلي، حيث سيكون هناك مزيد من الطلب من خلال، على سبيل المثال، ساعة. إنها تساعدنا على اقتراح برامج التشغيل حيث ستكون هناك المزيد من الطلبات حتى يتوافق العرض بالطلب.

- لا تعتقد أن "Yandex.taxi" سوف تقتل قريبا سوق سيارات الأجرة بأكملها؟

أعتقد لا. نحن لمنافسة صحية ولا تخاف منها.

أنا نفسي، على سبيل المثال، أستخدم خدمات سيارات الأجرة المختلفة. من المهم بالنسبة لي الانتظار الوقت، لذلك أنا أنظر إلى العديد من التطبيقات، ما سيأتي سيارة أجرة بشكل أسرع.


- لقد دمجت مع Uber. لماذا؟

ليس في تعليق اختصاصي. أعتقد أن التوحيد هو حل عميق معقول.

في ألمانيا، قام رجل واحد بتثبيت حمام على الطائرة بدون طيار وهكذا طار خلف البرغر. هل اعتقدت أنه حان الوقت لإتقان المجال الجوي؟

أنا لا أعرف عن المجال الجوي. بالنسبة للأخبار الموجودة في الروح "أطلق Uber سيارة أجرة على القوارب" نتابع، لكنني لا أستطيع أن أقول أي شيء عن الهواء.

- وسيارات الأجرة بدون طيار؟

هنا لحظة مثيرة للاهتمام. نطورهم، ولكن فوق كيف تحتاج إلى استخدامها، عليك أن تفكر. لا يزال من المبكر اتخاذ التنبؤات، في الشكل وعندما تظهر في الشوارع، لكننا نفعل كل شيء لتطوير التكنولوجيا لسيارة مستقلة بالكامل، حيث لا يحتاج السائق إلى برنامج تشغيل على الإطلاق.

- هناك مخاوف أن الطائرة بدون طيار من طائرات بدون طيار إلى الاختراق لإدارة السيارة عن بعد؟

هناك دائما مخاطر وفي كل مكان حيث توجد تكنولوجيات وأدوات. ولكن مع تطوير التقنيات، يتطور اتجاه آخر - حمايةهم وأمنهم. كل من يشارك بطريقة أو بأخرى في تطوير التقنيات، والعمل على أنظمة الحماية.

- ما هي البيانات المتعلقة بالمستخدمين التي تجمعها وكيف تدافع عنها؟

نقوم بجمع بيانات الاستخدام غير الشخصية، على سبيل المثال، من أين، متى وأين تم إجراء الرحلة. كل ذلك مهم - لقد كنا نواجه.

- هل تعتقد، بسبب الطائرات بدون طيار، سينخفض \u200b\u200bعدد الوظائف؟

أعتقد أنه سيكون أكثر من ذلك فقط. ومع ذلك، يجب أن تخدم هذه الطائرات بدون طيار أيضا بطريقة أو بأخرى. هذا، بالطبع، حالة مرهقة قليلا، تغيير التخصص، ولكن ما يجب القيام به.

- يقول GREF في كل محاضرة أن الشخص سيغير مهنته ثلاث مرات على الأقل جذريا.

لا أستطيع الاتصال ببعض التخصص لعدة قرون. المطور لا يعمل طوال حياته بنفس اللغة والنفس التقنيات. في كل مكان تحتاج إلى إعادة بناء. مع التعلم الآلي، أشعر بوضوح مثل الرجال الذين هم أصغر من ست سنوات أصغر مني، أسرع بكثير. في الوقت نفسه، يشعر الأشخاص في 40 أو 45 عاما أنه أقوى.

- تجربة لم تعد تلعب دورا؟

يلعب. لكن الطرق تتغير، يمكنك المجيء إلى المنطقة حيث، على سبيل المثال، التدريب العميق لم يتم استخدامه، العمل هناك لبعض الوقت، ثم يتم تقديم طرق التدريب العميق في كل مكان، وأنت لا تفهم أي شيء في ذلك. وهذا كل شيء. يمكن أن تكون تجربتك مفيدة فقط في مسألة التخطيط لعمل الفريق، وهي ليست دائما.

- ما هي مهنتك - عالم البيانات، هل في الطلب؟

في المتخصصين في علوم البيانات، انتزح الطلب ببساطة. من الواضح، الآن فترة مجنون khaip. الحمد لله، ساعد bruckchain هذا حمايك للحفظ. لا يزال المتخصصون في Blockchain تفكيك.

لكن العديد من الشركات تعتقد الآن أنه إذا وضعوا المال في التعلم الآلي، فسوف يزهرون على الفور الحدائق. هذا ليس صحيحا. يجب أن يحل التعلم الآلي مهام محددة، وليس موجودا فقط.

هناك حالات عندما يريد بعض البنوك تقديم نظام توصية للمستخدمين. نسأل: "هل تعتقد أنه سيتم تبريره اقتصاديا؟" الرد: "نعم، نحن على التين. صنع. كل نفس أنظمة التوصية، سنكون في الاتجاه ".

الألم هو أن الشيء مفيد حقا للعمل لا يمكن القيام به في يوم واحد. تحتاج إلى مشاهدة كيفية تدريب النظام. وهي تعمل دائما في البداية مع الأخطاء، قد لا يكون لها ما يكفي من بعض البيانات عند التعلم. أنت تصحيح الأخطاء، ثم إصلاحه مرة أخرى وحتى redid كل شيء. بعد ذلك، تحتاج إلى تكوين بحيث يعمل النظام في الإنتاج ليكون مستقرا وقابل للتطوير، إنه وقت آخر. نتيجة لذلك، يستغرق مشروع واحد نصف عام، سنة وأكثر.


إذا نظرت إلى طرق تعلم الآلة كمربع أسود، فيمكنك بسهولة تخطي كيفية بدء بعض الهراء. هناك قصة ملهمة. طلب الجيش تطوير خوارزمية حيث يمكن تحليلها، هناك خزان في الصورة أم لا. فعل الباحثون، اختبارها، الجودة ممتازة، كل شيء رائع، أعطى الجيش. الجيش ويقول إن لا شيء يعمل. يبدأ العلماء في فهم عصبي. اتضح أنه في جميع الصور مع الخزان، مما أدى إلى الجيش، تم تثبيت علامة اختيار في زاوية المقبض. تعلمت الخوارزمية بلا عيوب العثور على علامة، وعدم أن يعرف شيئا عن الخزان. بطبيعة الحال، لم يكن هناك علامة على صور جديدة.

قابلت الأطفال الذين يقومون بتطوير أنظمة الحوار الخاصة بهم. أنت لم تفكر في أن مع الأطفال بحاجة إلى التعاون؟

لقد كنت أقود وقتا طويلا لجميع أنواع الأحداث لأطفال المدارس، قرأت المحاضرات حول تعلم الآلات. وبالتالي، بالمناسبة، قام أحد هؤلاء بتعليمني أن أقول لون تينت. كنت متأكدا تماما من أن قصتي ستكون جيدة ومثيرة للاهتمام، فخور، بدأت البث، والفتاة هي: "ونحن نريد تقليل هذا الشيء". أنا أنظر والتفكير، ولكن حقا، لماذا، والحقيقة يمكن تقليلها، وليس هناك شيء لإثبات أن إثبات هنا. لعدة سنوات مرت بالفعل، الآن هي محاضراتنا كطالب "Fiztech". ياندكس، بالمناسبة، yandex.lith، حيث يمكن لأطفال المدارس الحصول على معرفة أساسية مجانية بالبرمجة.

- جامعات ومشورة الجامعات والكليات حيث يتم الآن تدريس التعلم الآلي.

هناك كليات MIPT، FIVT و FPAM. حتى في "البرج" هناك كلية رائعة لعلوم الكمبيوتر، في جامعة موسكو الحكومية على ICD هناك تعلم الآلة. حسنا، والآن يمكنك الاستماع إلى مسارنا في رودن.

كما قلت، هذه المهنة في الطلب. طويل جدا، الأشخاص الذين تلقوا التعليم التقني شاركوا في شؤون مختلفة تماما. التدريب الآلي هو مثال رائع، عندما تكون هناك حاجة إلى كل الأشياء التي تم تدريسها مع التعليم التقني الآن، مفيدة ودفع جيدا.

- كيف جيدة؟

اسم المبلغ.

- 500 ألف شهريا.

يمكنك، فقط لا يجري عالم البيانات العادية. ولكن في بعض الشركات، يمكن أن يحصل المتدرب على العمل البسيط لآلاف 50. هناك مبعثر كبير جدا. بشكل عام، يمكن مقارنة راتب عالم البيانات شديد الانحدار بمدير الرواتب العام لبعض الشركة المتوسطة. في العديد من الشركات، بالإضافة إلى الراتب، لا يزال هناك العديد من الكعك للموظف، وإذا كان من الممكن أن ينظر إلى أن الشخص لم يأت إلى علامة تجارية جيدة في السيرة الذاتية للدخول، ولكن سيكون جيدا حقا.

مرت منذ عام تقريبا من اللحظة التي بدأت البند غير العادي في ورشة العمل المبتكرة المبتكرة في FIVTT. جوهرها هو إنشاء فرق الطلاب بدء تشغيل تكنولوجيا المعلومات تحت إشراف الموجهين ذوي الخبرة. اتضح جيدا: بفضل الدورة، قضى شخص ما جزءا من الصيف في وادي الكريم، تلقى شخص ما منحة بمبلغ 800000 روبل لتنمية المشروع، شخص ما على استعداد لاسترداد المشروع بالكامل. وهذا ليس كل نتائج ورشة العمل!

في أوائل عام 2011، تم جمع Trekchersnikov FVTT في قاعة التجميع وذكرت: خلال العام المقبل، ستحتاج إلى إنشاء بدء التشغيل الخاص بك. أخذ الطلاب هذا الاختصار هذه الفكرة: لم يكن من الواضح كيفية القيام بذلك على الإطلاق، والمسؤولية غير عادية - لا تزال ضرورية لإجراء أعمال تكنولوجية، وليس مشروع تعليمي آخر. هذا ما هو الفائز في أولمبياد الطالب من MFTI في الفيزياء هو التفكير، طالب القسم "Yandesca" فيكتور كانتور:

عندما، عندما تلقيت، اخترت FVT، كنت آمل أن يكون لدينا شيء مماثل. لذلك أنا سعيد لأنني على أمل عدم عبثا. خلال العام كان هناك شعور بأن الدورة ما زالت تشكلت، الكثير من الأشياء الجديدة في ذلك، تتحول العديد من الأسئلة إلى أنها مثيرة للجدل ليس فقط للطلاب، ولكن أيضا من أجل المنظمين، ولكن بشكل عام، أعتقد أن الاتجاهات إيجابية. اعجبني هذه الدورة

لتسهيل عمل الطلاب، تمت دعوة العديد من القيمين، الذين اقترحوا أفكارهم لبناء أعمال مبتكرة. وكان من بينهم أشخاص مختلفون تماما: من Star'Shekurov وطلاب الدراسات العليا من MFTI إلى مستشاري إرنست والشباب حول ابتكار يوري بافلوفيتش أموسوف (كان رأس الدورة بأكمله) وميخائيل باتينا، التي تعمل في الطب التجديدي و قضايا امتداد الحياة. نتيجة لذلك، اختارت FizTechs الأفكار الأكثر إثارة للاهتمام، والبرامج المرفقة بالفرق، وبدأت أعمال شديدة، ولكنه مثيرة.

تقريبا لهذا العام، واجه الرجال مع العديد من المشاكل، والتي تمكن بعضها من حلها. الآن يمكنك تقدير نتائجهم - على الرغم من الصعوبات التي تم التعامل معها. تم توصيل طلاب MFTI (بالإضافة إلى FIVTOS، وبعض طلاب FOPFA وكليات أخرى على العملية) من خلال إعداد العديد من المشاريع المثيرة للاهتمام ومثيرة للتطبيق:

Asheroid (اسأل في وقت سابق Droid) - ابحث عن الهواتف الذكية ( أناستازيا Uryashev.)

تطبيق Android، الذي يتيح لك البحث بسهولة عن أعداد كبيرة من محركات البحث. لقد أظهر بعض الخبراء اهتماما بالتنمية، ونتيجة لأناستازيا، تنفق جميع الصيف الماضي في واحدة من أشهر حاضنات وادي السيليكون - التوصيل والتشغيل. دراسة أساسيات ريادة الأعمال التكنولوجية والتحدث مع خبراء المغامرة الدولية.

1minute.ru - دقيقة واحدة في جيد (ليف موراجان)

هذا المشروع يجعل من الممكن لأي شخص ببساطة، بسرعة وخالية تماما من الانخراط في الخيرية. النموذج بسيط: يقدم المعلنون بعض أنواع النشاط على الموقع، ويشارك المستخدمون طوعا فيها، ويتم سرد جميع الأموال من الإعلانات في مؤسسة خيرية. بعد أسبوع من الإطلاق، جمع المشروع أكثر من 6500 مستخدم ولا يتوقف هناك. نتيجة لذلك، بفضل ليف وفريقه، سيتلقى 600 طفلا من الأيتام هدايا عزيزة من سانتا كلوز للعام الجديد. هل أمضيت بالفعل دقيقة واحدة للحصول على صفقة جيدة؟!

سطح المكتب المضمن - الكمبيوتر على هاتفك (Alexey Vukolov)

تطبيق يسمح لك بالجمع بين قضية واحدة. قدرات الكمبيوتر وتنقل الهاتف هو منتج مفيد للغاية للأشخاص المشغولين الذين غالبا ما يكونون في رحلات العمل. يكفي تثبيته على هاتفك الذكي، وسيتمكن المستخدم من "الحصول على" مع جهاز الكمبيوتر الخاص به في أي فندق، والمكتب وبالفعل أينما يمكنك العثور على شاشة (التلفزيون مناسب أيضا)، لوحة المفاتيح والماوس. تلقى المشروع منحة لتطوير الفكرة وتم عرضها في معرض كأس التكنولوجيا، والفريق اشترى بالفعل المعدات النشطة للأموال المستلمة. الشركة المصنعة الأمريكية من معالجات MIPs مهتمة للغاية بالتنمية.

Tagger Smart Tagger - البحث الدلالي بواسطة المستندات (Victor Kantor)

ماذا لو كنت تتذكر أنه في مكان ما في صندوق البريد، ضع حرفا مهما للغاية، تحدث عن سلسلة نظرية الانفجار الكبيرة الأخيرة، ولكن في نفس الوقت لا تتذكر أي كلمات رئيسية من النص؟ البحث Yandex وجوجل عاجزة. سيتم تطبيق Tagger الذكية على برنامج الإنقاذ - "SMART" باستخدام البحث الدلالي، وسوف يمنحك جميع النصوص، والمعنى الذي يتماشى مع المسلسلات التلفزيونية الشعبية. فاز المشروع بالمنحة في مسابقة u.m.n.i.k. المبلغ الإجمالي البالغ 400،000 روبل!

مهرجان مهرجان - التعرف على الصيغة (فيكتور براون)

قدم آبي مهمة مثيرة للاهتمام لتنفيذ - لإنشاء برنامج من شأنه أن يتعرف على الصيغ الرياضية لأي تعقيد. طلاب فيستا، التعاون مع fopphs المهتمين، والوفاء بالمهمة - الوحدة النمطية تعترف حقا الصيغ الممسوحة ضوئيا من الكتب المدرسية على Mathan أو الفيزياء. النتيجة: ABBYY مستعد لشراء الكثير من المنتجات مقابل المال الكبير.