Apakah itu Set Tahanan? Kadangkala dirujuk sebagai data "pengujian", subset penangguhan memberikan anggaran akhir prestasi model pembelajaran mesin selepas ia dilatih dan disahkan. Set holdout tidak boleh digunakan untuk membuat keputusan tentang algoritma yang hendak digunakan atau untuk menambah baik atau menala algoritma.
Adakah pengesahan silang lebih baik daripada bertahan?
Pengesahan silang biasanya merupakan kaedah pilihan kerana ia memberi model anda peluang untuk berlatih pada berbilang pemisahan ujian kereta api. Ini memberi anda petunjuk yang lebih baik tentang prestasi model anda pada data yang tidak kelihatan. Bertahan, sebaliknya, bergantung pada hanya satu pemisahan ujian kereta api.
Apakah pendekatan menahan diri?
Kaedah Tahan ialah jenis kaedah paling mudah untuk menilai pengelas. Dalam kaedah ini, set data (kumpulan item data atau contoh) diasingkan kepada dua set, dipanggil set Latihan dan set Ujian. Pengelas menjalankan fungsi memberikan item data dalam koleksi tertentu kepada kategori atau kelas sasaran.
Adakah saya perlu sentiasa melakukan pengesahan silang?
Secara umum pengesahan silang ialah sentiasa diperlukan apabila anda perlu menentukan parameter optimum model, untuk regresi logistik ini akan menjadi parameter C.
Apakah kelebihan pengesahan silang K kali ganda?
jika anda membandingkan ujian-MSE lebih baik dalam kes CV kali ganda daripada LOOCV. k-fold CV atau mana-mana CV atau kaedah pensampelan semula tidakmemperbaiki kesilapan ujian. mereka menganggarkan ralat ujian. dalam kes k-fold, ia melakukan kerja yang lebih baik untuk menganggarkan ralat daripada LOOCV.