Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Prakiraan Deret Waktu di Amazon SageMaker Canvas
catatan
Model peramalan deret waktu hanya didukung untuk kumpulan data tabel.
Amazon SageMaker Canvas memberi Anda kemampuan untuk menggunakan perkiraan deret waktu pembelajaran mesin. Prakiraan deret waktu memberi Anda kemampuan untuk membuat prediksi yang dapat bervariasi seiring waktu.
Anda dapat membuat perkiraan deret waktu untuk contoh berikut:
-
Perkiraan inventaris Anda dalam beberapa bulan mendatang.
-
Jumlah barang yang terjual dalam empat bulan ke depan.
-
Pengaruh penurunan harga pada penjualan selama musim liburan.
-
Persediaan barang dalam 12 bulan ke depan.
-
Jumlah pelanggan yang memasuki toko dalam beberapa jam ke depan.
-
Meramalkan bagaimana penurunan 10% dalam harga suatu produk mempengaruhi penjualan selama periode waktu tertentu.
Untuk membuat perkiraan deret waktu, kumpulan data Anda harus memiliki yang berikut:
-
Kolom stempel waktu dengan semua nilai yang memiliki tipe.
datetime
-
Kolom target yang memiliki nilai yang Anda gunakan untuk memperkirakan nilai masa depan.
-
Kolom ID item yang berisi pengidentifikasi unik untuk setiap item dalam kumpulan data Anda, seperti SKU angka.
datetime
Nilai dalam kolom stempel waktu harus menggunakan salah satu format berikut:
-
YYYY-MM-DD HH:MM:SS
-
YYYY-MM-DDTHH:MM:SSZ
-
YYYY-MM-DD
-
MM/DD/YY
-
MM/DD/YY HH:MM
-
MM/DD/YYYY
-
YYYY/MM/DD HH:MM:SS
-
YYYY/MM/DD
-
DD/MM/YYYY
-
DD/MM/YY
-
DD-MM-YY
-
DD-MM-YYYY
Anda dapat membuat perkiraan untuk interval berikut:
-
1 menit
-
5 menit
-
15 menit
-
30 menit
-
1 Jam
-
1 hari
-
1 minggu
-
1 bulan
-
1 tahun
Nilai masa depan dalam kumpulan data masukan Anda
Canvas secara otomatis mendeteksi kolom dalam kumpulan data Anda yang berpotensi mengandung nilai future. Jika ada, nilai-nilai ini dapat meningkatkan akurasi prediksi. Kanvas menandai kolom khusus ini dengan Future values
label. Canvas menyimpulkan hubungan antara data di kolom ini dan kolom target yang Anda coba prediksi, dan memanfaatkan hubungan itu untuk menghasilkan perkiraan yang lebih akurat.
Misalnya, Anda dapat memperkirakan jumlah es krim yang dijual oleh toko kelontong. Untuk membuat ramalan, Anda harus memiliki kolom stempel waktu dan kolom yang menunjukkan berapa banyak es krim yang dijual toko kelontong. Untuk perkiraan yang lebih akurat, dataset Anda juga dapat mencakup harga, suhu lingkungan, rasa es krim, atau pengenal unik untuk es krim.
Penjualan es krim mungkin meningkat ketika cuaca lebih hangat. Penurunan harga es krim dapat mengakibatkan lebih banyak unit terjual. Memiliki kolom dengan data suhu sekitar dan kolom dengan data harga dapat meningkatkan kemampuan Anda untuk memperkirakan jumlah unit es krim yang dijual toko kelontong.
Meskipun memberikan nilai future bersifat opsional, ini membantu Anda melakukan analisis bagaimana-jika secara langsung di aplikasi Canvas, menunjukkan kepada Anda bagaimana perubahan nilai future dapat mengubah prediksi Anda.
Menangani nilai yang hilang
Anda mungkin memiliki data yang hilang karena berbagai alasan. Alasan data Anda yang hilang mungkin menginformasikan bagaimana Anda ingin Canvas mengimplikasikannya. Misalnya, organisasi Anda mungkin menggunakan sistem otomatis yang hanya melacak saat penjualan terjadi. Jika Anda menggunakan kumpulan data yang berasal dari jenis sistem otomatis ini, Anda memiliki nilai yang hilang di kolom target.
penting
Jika Anda memiliki nilai yang hilang di kolom target, sebaiknya gunakan kumpulan data yang tidak memilikinya. SageMaker Canvas menggunakan kolom target untuk memperkirakan nilai masa depan. Nilai yang hilang di kolom target dapat sangat mengurangi keakuratan perkiraan.
Untuk nilai yang hilang dalam kumpulan data, Canvas secara otomatis memasukkan nilai yang hilang untuk Anda dengan mengisi kolom target dengan 0
dan kolom numerik lainnya dengan nilai median kolom.
Namun, Anda dapat memilih logika pengisian Anda sendiri untuk kolom target dan kolom numerik lainnya di kumpulan data Anda. Kolom target memiliki pedoman dan batasan pengisian yang berbeda dari kolom numerik lainnya. Kolom target diisi hingga akhir periode historis, sedangkan kolom numerik diisi di periode historis dan masa depan hingga akhir cakrawala perkiraan. Canvas hanya mengisi nilai future dalam kolom numerik jika data Anda memiliki setidaknya satu record dengan stempel waktu future dan nilai untuk kolom tertentu.
Anda dapat memilih salah satu opsi logika pengisian berikut untuk memasukkan nilai yang hilang dalam data Anda:
-
zero
— Isi dengan0
. -
NaN
— Isi dengan NaN, atau bukan nomor. Ini hanya didukung untuk kolom target. -
mean
— Isi dengan nilai rata-rata dari seri data. -
median
— Isi dengan nilai median dari seri data. -
min
— Isi dengan nilai minimum dari seri data. -
max
— Isi dengan nilai maksimum dari seri data.
Saat memilih logika pengisian, Anda harus mempertimbangkan bagaimana model Anda menafsirkan logika. Misalnya, dalam skenario ritel, mencatat penjualan nol dari item yang tersedia berbeda dengan mencatat penjualan nol dari item yang tidak tersedia, karena skenario terakhir tidak selalu menyiratkan kurangnya minat pelanggan pada item yang tidak tersedia. Dalam hal ini, mengisi kolom target dari kumpulan data dapat menyebabkan model menjadi kurang bias dalam prediksinya dan menyimpulkan kurangnya minat pelanggan pada item yang tidak tersedia. 0
Sebaliknya, mengisi dengan NaN
dapat menyebabkan model mengabaikan kejadian sebenarnya dari nol item yang dijual dari item yang tersedia.
Jenis prakiraan
Anda dapat membuat salah satu dari jenis prakiraan berikut:
-
Item tunggal
-
Semua item
Untuk perkiraan semua item dalam kumpulan data Anda, SageMaker Canvas mengembalikan perkiraan untuk nilai masa depan untuk setiap item dalam kumpulan data Anda.
Untuk perkiraan item tunggal, Anda menentukan item dan SageMaker Canvas mengembalikan perkiraan untuk nilai masa depan. Perkiraan mencakup grafik garis yang memplot nilai prediksi dari waktu ke waktu.