IDE pembelajaran mesin AWS SageMaker yang baru belum siap untuk merayu para ilmuwan data

AWS SageMaker, merek pembelajaran mesin AWS, mengumumkan rilis SageMaker Studio sebuah merek "IDE for ML" pada hari Selasa. Pembelajaran mesin telah mendapatkan dasar dan, dengan beban kerja pelatihan yang berat dalam komputasi, bisa terbukti menjadi faktor penentu dalam pertempuran yang sedang berkembang di cloud publik. Jadi apa arti IDE baru untuk AWS dan pasar cloud publik ini?

Pertama, ikhtisar (lihat di bawah untuk analisis fitur oleh fitur Studio): Ini adalah rahasia bahwa pangsa pasar SageMaker sangat kecil (informasi diperkirakan sekitar $ 11 juta pada Juli 2019). SageMaker Studio berupaya memecahkan masalah penting bagi ilmuwan data dan pengembang pembelajaran mesin (ML) dengan merampingkan pelatihan model dan beban kerja perawatan. Namun, implementasinya tidak memadai karena keluhan umum lama tentang AWS secara umum – kurva pembelajaran yang curam dan kompleksitasnya.

AWS jelas mengadopsi strategi penjualan ke komputasi bisnis sambil mengabaikan fitur dan pengalaman pengguna yang bisa membuat hidup lebih mudah bagi para ilmuwan dan pengembang data. Meskipun teknologi yang mendasari yang mereka rilis, seperti Notebook, Debugger, dan Model Monitor, berusaha memfasilitasi pelatihan ML, implementasi meninggalkan banyak yang harus diinginkan.

Pengalaman saya sendiri ketika mencoba mengakses SageMaker Studio adalah mikrokosmos dari masalah ini. Saya kesulitan menginstal Studio. Akun AWS yang ada tidak dapat terhubung ke layanan baru; Anda memerlukan sistem masuk tunggal AWS (SSO) baru. Konfigurasi sistem masuk tunggal membosankan, dengan pesan kesalahan yang tidak perlu seperti "Anggota harus memenuhi pola ekspresi reguler: [pLppppP] +" yang lebih cenderung membingungkan daripada d & # 39; 39; menerangi. Untuk menjalankan sesi SageMaker Studio, perlu juga dipahami model lengkap izin SSO – itu sendiri kurva pembelajaran yang curam. Rupanya, saya salah paham karena saya tidak pernah berhasil membuatnya bekerja. Dan itu berkat tips bermanfaat dari tiga karyawan AWS, salah satunya adalah seorang pengembang.

Pengalaman saya dengan SageMaker tidak unik. Artikel informasi yang sama ini menyatakan: "Seseorang yang bekerja pada proyek klien menggunakan teknologi menggambarkan layanan sebagai rumit secara teknis untuk digunakan, meskipun AWS berusaha membuat layanan lebih efisien. pembelajaran mesin lebih mudah diakses oleh pelanggan. jenis kompleksitas ini unik untuk SageMaker; seperti yang telah kita lihat, ini menjadi arus utama untuk semua produk cloud AWS. Sementara itu, kompetitornya Google Cloud akan memiliki pengalaman pengembang terbaik akan lebih "ramah, " dan " lebih memperhatikan kebutuhan pengembang profesional .

Untuk saat ini, investor tidak perlu khawatir. Memilih kompleksitas daripada kesederhanaan mungkin merupakan pilihan yang tepat, dengan fokus pada kebutuhan pembeli TI bisnis besar yang mengakar yang berfokus pada keamanan granularity dan daftar periksa yang dapat disesuaikan. fitur (AWS memiliki 169 produk terpisah pada Mei tahun ini). Sayangnya, ini dilakukan dengan mengorbankan kurva belajar yang curam dan kegunaan dari pengembang. Walaupun ini mungkin strategi yang tepat untuk saat ini, kompleksitas Studio membuka AWS terhadap potensi gangguan gaya-Christensen (pikirkan Dilema the Innovator ). Ukuran AWS yang sangat besar (secara luas diakui sebagai penyedia cloud terbesar) memiliki banyak keunggulan – kemampuan untuk mendukung penawaran yang lebih luas, basis pengembang bersertifikasi yang lebih besar, penghematan yang lebih besar di masa depan. 39; skala – untuk beberapa nama. Tetapi tahun ini telah melihat IPO Zoom dan Slack dua perusahaan B2B yang telah melewati jalur tradisional penjualan TI perusahaan dengan menaklukkan hati dan pikiran pengguna akhir dan memaksa tangan pembeli. Bisakah pemain serupa untuk pengembang menggantikan AWS?

Apa yang SageMaker Studio Tawarkan

Sekarang mari kita lihat fitur-fitur Studio: SageMaker telah mengumumkan beberapa fitur baru yang menarik di Studio: laptop, eksperimen, debugger, monitor model, dan AutoPilot.

SageMaker Notebooks berupaya memecahkan hambatan terbesar bagi orang yang mempelajari ilmu data: untuk menjalankan lingkungan Python atau R dan mencari tahu cara menggunakan laptop. Studio menyediakan notebook sekali klik untuk lingkungan SageMaker, dalam persaingan langsung dengan Google Colab atau Microsoft Azure Notebooks dalam kategori Notebook-as-a-Service . Tetapi SageMaker memiliki instans Notebook sejak 2018 dan tidak jelas perbaikan seperti apa yang ditawarkan Studio di bagian depan ini.

Eksperimen SageMaker menyediakan kemampuan pelaporan untuk pekerjaan jangka panjang. Ini nyaman karena Anda sering tidak tahu berapa lama pekerjaan akan terus berjalan atau di mana ia terjebak di latar belakang. Fitur Experiences harus menjadi tambahan yang berguna untuk pekerjaan berbasis cloud, kumpulan data besar, atau proyek intensif GPU. Namun, itu ada (walaupun berpotensi dalam bentuk yang kurang visual) bahkan dari Juli 2018 . Sekali lagi, sulit untuk mengetahui bagaimana produk ini lebih baik dari pendahulunya.

SageMaker Debugger berjanji untuk menyederhanakan proses debugging. Pengumuman fitur ini dilengkapi dengan penjelasan terperinci, termasuk potongan kode yang menunjukkan bagaimana alat ini dapat membantu pengembang men-debug bug Tensorflow yang buram (mungkin dapat bekerja atau akan bekerja dengan d & # 39; alat ML lainnya).

Saya berbicara dengan Field Cady penulis The Data Science Handbook tentang nilai alat ini. "Model pembelajaran mesin debugging, terutama model kompleks seperti Tensorflor atau PyTorch, adalah masalah nyata dan tidak menemukan kesalahan lebih awal ketika Anda dapat melakukan tugas pelatihan multi-hari benar-benar menghambat produktivitas," katanya. "Akses langsung ke model, bahkan jika mereka belum sepenuhnya terlatih, memungkinkan Anda untuk menyelesaikan masalah integrasi ini secara paralel dengan pelatihan itu sendiri." Secara keseluruhan, fitur ini terlihat sangat baru dan memecahkan masalah nyata bagi pengguna.

SageMaker Model Monitor memantau model di SageMaker Endpoints untuk penyimpangan data. Ini mungkin fitur yang paling menarik dari Studio karena membantu mengingatkan pembuat model tentang penyimpangan input data (dan karenanya model). Mengutip CEO AWS Keynote Andy Jassy pada konferensi reinvent tahun ini, model hipotek yang dibentuk dengan data perumahan 2005 dapat bekerja dengan baik pada tahun 2006, tetapi kemungkinan akan gagal selama dari pecahnya gelembung real estat pada tahun 2008 karena perubahan input dari model yang mendasarinya. Suatu sistem yang dapat secara otomatis memperingatkan pembuat model terhadap perubahan ini sangat berharga. Monitor Model memiliki keuntungan nyata dari standarisasi model hosting di SageMaker Endpoints, layanan hosting model AWS, dalam persaingan langsung dengan Google AI Platform dan awal Algorithmia .

S ageMaker AutoPilot adalah bagian dari kategori AutoML, yang secara otomatis menggerakkan model ML dari file data CSV. Produk ini bersaing dengan DataRobot yang mengumpulkan $ 206 juta pada seri E September lalu . Meskipun jenis alat ini memiliki beberapa kelebihan (mungkin lebih murah daripada meminta ilmuwan untuk melakukan langkah ini), ini juga mungkin merupakan kategori yang paling disalahpahami dari yang telah kami periksa sejauh ini. Ketika saya membahas alat dengan Cady, ia mencatat sedikit rahasia kotor dari ilmu data: sementara sebagian besar hype difokuskan pada 10% pekerjaan yaitu ML dan pelatihan, 90% pekerjaan datang lebih cepat. "Pada saat Anda memiliki CSV, Anda telah melakukan 90% pekerjaan. Sebagian besar data ilmiah berasal dari memikirkan set data yang tepat untuk digunakan, variabel hasil yang tepat untuk ditargetkan, bias dalam data Anda, dan kemudian menggabungkan dan merakitnya, "katanya, sehingga sementara AutoPilot dapat mempercepat ML, ia tidak melakukan apa pun untuk mempercepat pekerjaan inti seorang ilmuwan data. [19659008] Hasilnya

Jadi, apa yang dikatakan di sini tentang SageMaker Studio? Ini tentang tas campuran, dengan beberapa fitur yang tampaknya hanya perubahan merek. produk lama dan lainnya yang memecahkan masalah baru yang sah bagi pelanggan. Bahkan fitur baru terbaik adalah peningkatan bertahap untuk produk yang sudah ada. Untuk menjadi transformator, AWS harus secara khusus menangani masalah penggunaan lebih penting dalam SageMa Ker dan ekosistem AWS yang lebih luas.

Mungkinkah gaya Christensen keluar dari AWS? Hanya waktu yang akan menjawab. Dengan alat-alat seperti Notebook, Debugger dan Model Monitor, AWS tampaknya berusaha untuk memenangkan hati dan pikiran para pengembang dan data para ilmuwan. Namun sejauh ini, upaya ini tampaknya gagal.

Tianhui Michael Li adalah ketua data di Pragmatic Institute dan pendiri Inkubator Data .

Leave a Reply

Your email address will not be published. Required fields are marked *

*