Kehidupan sebagai Penerjemah (10): Belajar
Pada 2011, saya menerjemahkan sejumlah karya yang saya pilih dalam bidang psikologi, semata-mata untuk memperkaya materi kuliah Psikologi Umum bagi mahasiswa di fakultas psikologi. Terjemahan ini tidak dimaksudkan pertama-tama untuk dikutip. Kendati demikian, apabila hendak dikutip juga, Anda dapat menerakan hal sebagai berikut di dalam Daftar Pustaka Anda:
….
Ketika sebuah dering telepon seluler berbunyi di sebuah bus atau kereta, orang sama-sama memeriksa apakah telepon seluler mereka yang berbunyi. Hal ini merupakan contoh jelas dari respons yang hampir otomatis terhadap sebuah stimulus. Hal ini menggambarkan salah satu hukum fundamental yang mendasari behaviorisme, yakni ikatan antara stimulus (rangsang) dan respons (jawab).
Psikologi behavioristik merupakan teori belajar (theory of learning) yang paling berpengaruh dan mengklaim dirinya memiliki basis ilmiah. Teori ini dianggap universal dan berlandaskan sejumlah kecil prinsip. Sebagaimana namanya, psikologi ini berkonsentrasi pada perubahan tingkah laku (behavioral changes) pada organisme. Para behavioris mendefinisikan belajar (learning) sebagai sebuah perubahan yang relatif permanen dalam tingkah laku sebagai hasil dari pengalaman. Perubahan perilaku ini selalu teramati (observable). Sejumlah behavioris menyatakan bahwa apabila tidak ada perubahan perilaku yang teramati, maka tidak ada pembelajaran yang terjadi. Meskipun behavioris tidak menyangkal bahwa pelajar itu berpikir, namun kaum behavioris utamanya memilih untuk mengabaikan proses-proses mental yang tak dapat diakses, serta berfokus pada perilaku terobservasi. Penggunaan binatang dalam eksperimen-eksperimen awal oleh behavioris, yang membatasi observasi terhadap tingkah laku eksternal, telah menguatkan eksklusi (pengecualian) terhadap aktivitas kognitif oleh behavioris.
Meskipun ada masalah dengan penghindaran behavioris terhadap diskusi aktivitas mental, teori-teori psikologi behavioristik memunculkan minat kritis mengenai apa yang dapat dilakukan para pelajar untuk belajar. Lebih lanjut, sejumlah behavioris berikutnya telah mengakui kegiatan kognitif dengan menekankan pentingnya harapan (ekspektasi) dan motivasi dalam proses belajar.
Pengkondisian Klasik (Classical Conditioning)
Behaviorisme muncul pada tahun-tahun akhir dari abad ke-19 ketika fisiolog (ahli faal) seperti Ivan Pavlov menyelidiki respons otomatis dan tak disengaja (involunter) dari binatang terhadap stimuli (Pavlov, 1927). Behavioris klasik meyakini bahwa semua pembelajaran tunduk pada hukum-hukum ilmiah teramati yang mengatur asosiasi-asosiasi dan pola-pola. Pelajar hanya merespons terhadap stimuli eksternal dalam tingkah laku deterministik.
Gambar 38 mengilustrasikan eksperimen klasik Pavlov dengan anjing. Pavlov mencatat bahwa bau makanan menyebabkan anjing mengeluarkan saliva (air liur). Air liur ini merupakan “respons tak terkondisikan” (unconditional response / UR) karena merupakan reaksi natural anjing terhadap makanan (“stimulus tak terkondisikan” / unconditional stimulus / US). Pavlov kemudian membunyikan bel (“stimulus kondisional” / conditional stimulus / CS) yang lekas disusuli dengan makanan. Pavlov menemukan bahwa setelah sejumlah repetisi (pengulangan), maka bel sendirian cukup untuk menyebabkan salivasi. Hal ini merupakan respons “kondisional” atau terlatih (conditional response / CR), dan terjadi secara berdekatan (waktu) dengan respons tak terkondisikan.
Gambar 38. Eksperimen pengkondisian klasik Pavlov
Pavlov juga mengamati bahwa anjing yang terkondisikan untuk mengeluarkan air liur setelah disajikan bel (CS) juga mengeluarkan air liur pada saat melihat benda yang mirip dengan bel (padahal bukan bel). Hal ini disebut generalisasi stimulus. Tingkah laku stereotyping (menstereotipkan orang lain, misalnya orang dari suku tertentu) merupakan contoh dari generalisasi stimulus terhadap semua orang dari kelompok suku yang sama.
Pavlov kemudian melangsungkan serangkaian percobaan, di mana bel selalu diikuti dengan makanan, namun benda yang mirip bel tidak pernah diikuti dengan makanan. Setelah sejumlah repetisi, anjing secara andal mengeluarkan air liur terhadap bel, namun tidak mengeluarkan air liur terhadap benda yang mirip bel. Hal ini menunjukkan adanya diskriminasi stimulus (pembedaan rangsang), dalam hal mana organisme dikondisikan untuk membedakan antar dua rangsang. Pavlov juga menyatakan bahwa pembedaan rangsang selalu mensyaratkan pelatihan (training). Apabila latihan tidak ada lagi, maka organisme cenderung melakukan generalisasi rangsang. Di samping itu, dimungkinkan terjadinya kombinasi antara generalisasi dan diskriminasi stimulus.
Bila stimulus kondisional (bel) secara berulang disajikan tanpa stimulus tak terkondisi (makanan), maka respons terkondisi (saliva) akan menurun (melemah) sampai dengan tiada (non-existent). Hal ini disebut pemunahan respons (extinction). Mengapa hal ini terjadi? Karena respons terkondisi anjing (CR) tidak lagi adaptif. Pemunahan respons ini menunjukkan bahwa hal yang telah kita pelajari (learned) dapat kita lepaskan (unlearned), juga bahwa CR tidak perlu permanen.
Namun demikian, Pavlov juga menyatakan bahwa tanpa adanya manipulasi kondisi pemunahan, respons terkondisi (CR) masih mungkin dorman (tidak aktif, namun bukan berarti CR itu punah/hilang) sampai dengan organisme menjumpai stimulus terkondisikan (CS) kembali. Sebagai contoh, respons rasa takut seseorang yang berhubungan dengan suara bor dokter gigi dapat bertahan dalam interval antar waktu kunjungan ke dokter gigi (interval itu bisa saja waktu yang panjang). Mengapa? Karena tidak ada pelatihan pemunahan respons (active extinction training). Pavlov menyebut kembalinya respons terkondisikan, dalam hal mana anjing mengeluarkan air liur dengan hanya mendengar bunyi bel, setelah beberapa saat periode pemunahan respons, sebagai pemulihan spontan respons (spontaneous recovery). Hal ini menunjukkan bahwa, dalam hal kondisioning, hal-hal yang kita pelajari tidak pernah kita lupakan, melainkan hanya “terlapisi” oleh pengalaman yang lain. Rasa takut yang muncul kembali setelah lama kita menganggap bahwa kita telah berhasil mengalahkan rasa takut itu (misalnya, takut ke dokter gigi, takut berbicara di depan umum) mencerminkan sifat bertahan dari tingkah laku yang terkondisi.
Pavlov juga mengemukakan fenomena higher order conditioning. Misalnya, seorang anak yang mengeluarkan air liur ketika mendengar kata “kue”. Mungkin anak tersebut sebelumnya telah mengembangkan respons terkondisi (CR) mengeluarkan air liur dengan melihat kue (kue sebagai CS asli). Selanjutnya, ketika ia belajar bicara, kata “kue” terasosiasikan dengan pemandangan kue. Dengan repetisi pemasangan kata “kue” dengan penglihatan kue, anak mengalami pengkondisian tingkat tinggi, di mana ia mengeluarkan air liur semata-mata karena mendengar secara verbal kata “kue”.
Prinsip respons kondisional telah menjadi dasar modifikasi perilaku yang disebut “pengkondisian klasik” yang merupakan salah satu jantung behaviorisme. Kaum behavioris cenderung menggunakan istilah “pengkondisian” (conditioning) ketimbang “belajar” (learning) guna menunjukkan bahwa subjek diubahkan oleh peristiwa eksternal ketimbang peristiwa kognitif. Teori pengkondisian klasik dapat digunakan untuk menjelaskan bagaimana orang mempelajari beragam respons yang tidak disengaja (involunter), khususnya respons-respons yang berasosiasi dengan fungsi psikologis atau emosi. Sebagai contoh, kebanyakan orang mengalami kegelapan sebagai stimulus tak terkondisi untuk tidur; karenanya, dalam situasi lingkungan tertentu, kegelapan dapat memunculkan respons “pergi tidur” (mengantuk, dan sebagainya). Pengkondisian klasik juga berguna untuk menjelaskan perkembangan rasa takut dan fobia. Sebagai contoh, seseorang yang digigit seekor anjing dapat menjadi takut pada kawanan anjing atau bahkan semua anjing. Contoh lain, jika Anda biasanya makan pagi pada waktu tertentu setiap harinya, respons terkondisi ini memungkinkan perut Anda menjadi aktif ketika sudah menjelang waktu makan. Respons terkondisi ini memungkinkan badan Anda untuk secara tepat mengantisipasi hadirnya makanan.
Psikolog Amerika John Watson memperluas peran pengkondisian klasik melampaui refleks-refleks dengan mencakup respons-respons emosional, dan menunjukkan prinsip generalisasi. Eksperimennya yang terkenal, “Little Albert” memperlihatkan bagaimana emosi takut dapat dikondisikan. Eksperimen ini melibatkan seorang bayi berusia 11 tahun yang belajar menakuti tikus putih melalui asosiasi terkondisi dengan suara keras. Albert Kecil selanjutnya terkondisi untuk menakuti objek atau binatang serupa (conditioned emotional response), seperti kelinci putih, mainan berbulu putih, dan wol katun; dengan perkataan lain, ketakutannya mengalami generalisasi (Watson & Rayner, 1920).
Watson juga menuntut penggunaan objektivitas ilmiah dalam belajar serta menemukan istilah “behaviorisme” (Watson, 1913). Watson merupakan seorang behavioris awal yang paling radikal. Pernyataannya yang paling terkenal (Watson, 1930, h. 82), sebagai berikut:
Give me a dozen healthy infants, well-formed, and my own specified world to bring them up in, and I’ll guarantee to take any one at random and train him to be any type of specialist I might select — doctor, lawyer, artist, merchant-chief and, yes, even beggar-man and thief, regardless of his talents, penchants, tendencies, abilities, vocations and the race of his ancestors.
Clark Hull (1943) berupaya mendeskripsikan tingkah laku dengan serangkaian hukum-hukum ilmiah dengan banyak variabel dan persamaan-persamaan (equations) kompleks. Teorinya menjadi tipikal dalam pendekatan ilmiah terhadap psikologi dewasa ini. Hull dipengaruhi oleh teori evolusioner Darwinian dan menyatakan bahwa tingkah laku berfungsi sebagai sebuah mekanisme bertahan hidup (survival). Bagi Hull, tingkah laku diarahkan menuju maksimalisasi peluang bertahan hidup. Teorinya berkisar pada pemuasan kebutuhan biologis, termasuk rasa lapar, haus dan tidur, yang esensial untuk bertahan hidup.
Menurut Hull, organisme memiliki dua karakteristik kunci, yakni dorongan (drive) dan kekuatan kebiasaan (habit strength). Dorongan merupakan kondisi keterbangkitan (arousal) internal, yang memotivasi tingkah laku. Kekuatan kebiasaan mengukur asosiasi antara sebuah stimulus tertentu dengan respons. Organisme biasanya akan memilih respons yang terkait dengan kebiasaan terkuat. Sebagai contoh, tikus dalam labirin (maze) secara umum akan memilih rute atau jalur yang paling akrab baginya.
Behavioris klasik memandang bahwa stimulus secara langsung menimbulkan respons. Sebagai perbandingan, Hull menyatakan bahwa di antara stimulus dan respons terdapat variasi dorongan dan kekuatan kebiasaan pada organisme. Jadi respons tidak hanya bergantung pada stimulus namun juga pada karakteristik organisme. Dalam pandangan klasik, bagan hubungannya adalah sebagai berikut: Stimulus è Respons. Sedangkan, dalam pandangan Hull, bagan hubungannya adalah sebagai berikut Stimulus è Organisme (dorongan dan kekuatan kebiasaan) è Respons. Bagan Hull menunjukkan organisme sebagai variabel intervening antara stimulus dan respons.
Tabel 9 meringkas istilah-istilah kunci yang digunakan dalam pengkondisian klasik.
Istilah
Penjelasan
Pengkondisian klasik
Belajar dalam mana subjek merespons stimulus kondisional secara berulang yang disajikan bersamaan dengan stimulus tak terkondisikan.
Stimulus tak terkondisikan
Setiap stimulus yang memunculkan reaksi otomatis pada organisme.
Stimulus netral
Stimulus yang tidak menyebabkan respons organisme.
Stimulus kondisional
Stimulus netral yang memunculkan reaksi tertentu karena asosiasinya dengan stimulus tak terkondisikan.
Respons tak terkondisikan
Reaksi otomatis yang dimunculkan oleh sebuah stimulus.
Respons kondisional
Tingkah laku yang terjadi ketika stimulus kondisional disajikan.
Kontiguitas
Asosiasi yang dekat (dalam konteks waktu) antara stimuli kondisional dan stimuli tak terkondisikan.
Pemunahan respons
Eliminasi atau peniadaan tingkah laku dengan menghapus atau meniadakan stimulus tak terkondisikan
Variasi
Proses menganekaragamkan stimuli untuk menghasilkan lebih banyak respons yang dapat digeneralisasikan.
Generalisasi
Tingkah laku yang terjadi ketika organisme berespons dengan cara yang sama terhadap stimulus yang serupa dengan stimulus kondisional asli.
Stimuli dorongan
Kebutuhan-kebutuhan seperti lapar, haus, dan tidur.
Repetisi
Pola dalam mana penyajian stimulus dan respons yang sering dan berdekatan dirancang untuk menghasilkan asosiasi antara stimulus dan respons.
Kekuatan kebiasaan
Frekuensi asosiasi antara stimulus tertentu dan respons, yang biasanya menyebabkan organisme memilih respons yang terkait dengan kebiasaan terkuat.
Tabel 9. Istilah kunci dalam pengkondisian klasik
Pengkondisian operan
Setelah Pavlov, psikolog Amerika Edward Thorndike memperkenalkan teori belajar yang menekankan peran pengalaman dalam memperkuat atau memperlemah ikatan stimulus-respons (Thorndike, 1911). Dalam eksperimennya, seorang kucing lapar diletakkan dalam sebuah kotak puzzle (Gambar 39). Kucing dapat keluar dari kotak tersebut dan memakan ikan yang ada di luar kotak apabila menekan sebuah pengungkit di dalam kotak. Setelah banyak tingkah laku coba-salah (trial and error), kucing belajar mengasosiasikan penekanan pengungkit dengan terbukanya pintu kotak. Asosiasi ini menghasilkan kondisi yang memuaskan (keluar dari kotak dan makan ikan). Selanjutnya, setiap kali kucing tersebut ditaruh dalam kotak, waktu yang dibutuhkan untuk kucing menekan pengungkit dan keluar dari kotak menjadi lebih singkat (efisien), karena kucing telah belajar.
Berdasarkan eksperimen ini, Thorndike mengajukan tiga buah hukum. Pertama hukum akibat (law of effect). Apabila sebuah respons (misalnya, mengerjakan sebuah soal matematika) diikuti dengan pengalaman yang menyenangkan (misalnya, jawaban siswa benar dan dipuji oleh guru), maka respons akan diperkuat dan menjadi kebiasaan (habitual). Kedua, hukum latihan (law of exercise). Koneksi atau hubungan antara stimulus (misalnya, jawaban benar) dengan respons (misalnya, mengerjakan soal matematika) dapat diperkuat dengan latihan, dan melemah jika latihan tidak dilanjutkan. Ketiga, hukum kesiapan (law of readiness). Tingkah laku tertentu lebih mungkin untuk dipelajari ketimbang tingkah laku yang lain karena sistem saraf organisme siap membuat hubungan yang menimbulkan kondisi memuaskan. Hal ini adalah persiapan bagi tindakan.
Gambar 39. Eksperimen Thorndike
Dengan perkataan lain, Thorndike meyakini bahwa respons-respons tepat yang dihadiahi (rewarded) dengan hasil yang memuaskan akan memperkuat tingkah laku tertentu. Sedangkan, pengabaian respons-respons yang tidak tepat (misalnya respons-respons yang tidak membuat pintu kotak terbuka) akan memperlemah secara bertahap respons-respons tersebut. Ini adalah prinsip penguatan (reinforcement), yang didefinisikan sebagai setiap peristiwa yang meningkatkan probabilitas (peluang) terulangnya kembali tingkah laku terkait. Gagasan Thorndike bahwa hadiah (reward) meningkatkan belajar merupakan salah satu komponen kunci teori behavioris dewasa ini. Eksperimennya memberikan informasi mengenai sifat dari tingkah laku volunter (sukarela / sengaja) atau terarah pada diri (self-directed), dikontraskan dengan respons-respons sederhana yang ditekankan dalam pengkondisian klasik. Meskipun Thorndike tidak langsung merujuk pada kognisi, penelitian-penelitiannya tentang coba-salah menunjukkan bahwa para subjek melakukan sejumlah tingkat pemrosesan informasi mental tertentu.
Burhaus Frederic Skinner merupakan psikolog yang paling dikenal dalam tradisi behavioris Amerika. Pada 1930, ia mengadopsi pendekatan terstruktur yang disebut “pengkondisian operan” dalam mana tingkah laku volunter subjek merupakan fungsi dari konsekuensi tingkah lakunya sendiri (Skinner, 1938). Sebagai contoh, dalam “Kotak Skinner” (Skinner Box)-nya (Gambar 40), Skinner menggunakan penguatan positif (positive reinforcement) untuk melatih tikus menekan pengungkit guna memperoleh sebongkah makanan. Penguatan positif yang diberikan oleh makanan meningkatkan peluang bahwa tikus akan menekan pengungkit tersebut lagi. Penguatan negatif (negative reinforcement) menghapus stimulus aversif (stimulus yang menyakitkan atau merugikan) setelah respons yang tepat; sebagai contoh, tikus menekan sebuah pengungkit untuk meniadakan kejutan listrik. Peredaan pengalaman sakit juga meningkatkan probabilitas bahwa pengungkit akan ditekan kembali.
Gambar 40. Kotak Skinner
Skinner menggunakan istilah “penguat” (reinforcer) ketimbang “hadiah” (reward), karena “penguat” memiliki asosiasi dengan tingkah laku, sedangkan “hadiah” tidak. Sebuah respons yang diikuti oleh stimulus penguat itu diperkuat, dan karenanya lebih mungkin untuk terjadi kembali. Makin besar dan makin menarik (atraktif) penguat, makin cepat respons akan dipelajari. Sebuah respons yang tidak diikuti oleh stimulus penguat akan diperlemah, dan karenanya kurang mungkin untuk terjadi kembali. Kaitan antara stimulus dan respons secara gradual akan melemah dan selanjutnya tiada. Sebagai contoh, tikus secara berulang menekan sebuah pengungkit tanpa menerima makanan pada akhirnya akan meninggalkan tingkah laku tersebut (pemunahan respons). Maka, tingkah laku yang diinginkan (desired) dan dihadiahi menyebabkan frekuensi tingkah laku itu meningkat; tingkah laku yang tak diinginkan (undesired) dan dihukum menyebabkan frekuensi tingkah laku itu menurun.
Meskipun Skinner tidak memandang hukuman (punishment) seefektif penguat (reinforcement) dalam memodifikasi tingkah laku, namun hukuman umumnya masih digunakan sebagai penghalang tingkah laku. Jenis-jenis penguat dan hukuman (Oates, Sheehy, & Wood, 2005) ditunjukkan pada Gambar 41.
Gambar 41. Jenis-jenis penguat dan hukuman
Versi lain dari jenis-jenis penguat (reinforcer) dari Skinner juga nampak dalam Tabel 10 berikut ini, meskipun Skinner juga mengingatkan bahwa dalam menentukan apakah penguat itu primer atau tekondisi, positif atau negatif, atau kombinasinya, hanya dapat dilakukan dengan merujuk pada situasi spesifik.
Penguat Primer
Penguat Terkondisi
Penguat Positif
Makanan
Air
Rumah/Perlindungan
Perhatian
Pujian
Uang
Penguat Negatif
Pukulan fisik
Kepanasan
Kejutan listrik
Diabaikan
Dikritik
Denda
Tabel 10. Jenis-jenis penguat
Apabila kita mempelajari mengenai pemunahan respons (extinction), yakni ketika respons melemah bahkan punah ketika penguat tidak diberikan lagi (diskontinu), maka konsekuensinya, agar efektif, penguat harus diberikan secara berkelanjutan (kontinu) untuk setiap respons yang tepat atau diharapkan. Namun demikian, dalam dunia nyata, hal ini jarang terjadi. Misalnya, seorang mahasiswa belajar secara teratur, namun menerima penguatan (misalnya nilai ujian), setelah tes tertentu. Karyawan pergi kerja setiap hari, namun dibayar mingguan atau bulanan. Bagaimanakah pengkodisian operan diterapkan untuk menjelaskan tingkah laku tersebut?
Pada awal-awal penelitiannya, Skinner menyadari bahwa dalam hidup sehari-hati, kita jarang mengalami (1) pemunahan yang sesungguhnya (tidak menerima penguat sama sekali), dan (2) penguatan berkelanjutan (menerima penguatan setiap kali berespons). Kita cenderung menjumpai sesuatu yang berada di tengah-tengahnya. Sejumlah respons diteguhkan/dikuatkan/dikukuhkan (reinforced), sedangkan sejumlah respons lainnya tidak. Skinner memunculkan istilah “penguatan parsial” (partial reinforcement) untuk mendeskripsikan situasi-situasi dalam mana penguatan diberikan kadang-kadang (intermittently). Guna membedakan berbagai jenis penguatan intermiten ini, Skinner memunculkan istilah jadwal penguatan (schedules of reinforcement). Jadwal-jadwal penguatan itu adalah sebagaimana nampak dalam Tabel 11 (Glassman & Hadad, 2009).
Jadwal
Penjelasan
Penguatan berkelanjutan (continuous reinforcement schedule)
Setiap respons menerima penguat.
Penguatan parsial (partial reinforcement schedule)
Penguat tidak mengikuti/menyusuli setiap respons.
Jadwal rasio (ratio schedules)
Pemberian penguat bergantung pada jumlah respons yang dibuat.
Jadwal interval (interval schedule)
Pemberian penguat bergantung pada waktu.
Jadwal reguler (fixed schedule)
Penguat disajikan setelah jumlah respons atau waktu tertentu, misalnya setiap respons ke-3, setiap 15 detik, dan sebagainya.
Jadwal tak terduga (variable schedules)
Pemberian penguat yang tidak tentu jadwalnya.
Jadwal rasio tetap (fixed ratio schedule / FR)
Penguat disajikan setelah jumlah respons tertentu.
Contoh: Sebuah pakaian dirancang memiliki 7 kancing untuk dijahit. Seorang pekerja yang menyelesaikan 1 baju akan memperoleh Rp 10.000. In disimbolkan sebagai FR 7.
Jadwal rasio variabel (variable ratio schedule / VR)
Penguat disajikan setelah rata-rata jumlah respons yang tertentu.
Contoh: Seorang pemancing ikan umumnya tidak selalu sukses menangkap ikan besar, dan tidak dapat meramalkan kapan bisa menangkap ikan besar. Jadi mereka tetap berupaya, karena mereka tahu bahwa suatu saat akan memperolehnya.
Jadwal interval tetap (fixed interval schedule / FI)
Penguat disajikan setelah interval waktu tertentu, misalnya setiap 15 detik.
Contoh: Seseorang minum obat setiap 4 jam sekali, untuk menghindari dosis berlebihan.
Jadwal interval variabel (variable interval schedule / VI)
Penguat disajikan setelah rata-rata interval waktu tertentu.
Contoh: Inspeksi mendadak Menteri Perhubungan ke Stasiun Kereta Api tertentu untuk mengecek kinerja bawahannya.
Tabel 11. Jadwal penguatan
Efek terhadap pola tingkah laku dari setiap jadwal penguatan tersaji dalam Gambar 42.
Gambar 42. Pola respons berdasarkan jadwal penguatan
Dalam FR, apabila rasionya terlalu tinggi (sulit dicapai), maka organisme bereaksi seolah-olah sedang berada dalam situasi pemunahan (extinction). Misalnya, untuk memperoleh 1 penguat, orang harus menunjukkan 150 respons. Sebagaimana nampak dalam gambar, VR maupun FR menghasilkan respons yang stabil, namun VR ternyata secara keseluruhan lebih baik dalam hal ini. FI merupakan bentuk penguatan yang cukup sering ditemui dalam hidup sehari-hari (misalnya, sistem pembayaran jam kerja lembur berdasarkan jumlah jam yang dihabiskan, tanpa memperhitungkan kinerja jumlah hal yang berhasil diselesaikan). Jika kita ingin menghasilkan respons yang stabil, FI bukanlah jadwal penguatan yang direkomendasikan, sebagaimana nampak dalam gambar. Dibandingkan dengan VR, jadwal VI cenderung menghasilkan respons yang lebih lambat namun stabil. Secara keseluruhan, jadwal VR merupakan jadwal yang paling efektif. Diskusikanlah bersama dengan teman-teman sekelas Anda, mengapa demikian?
Secara umum pula, tingkah laku yang diperoleh dalam kondisi penguatan parsial lebih bertahan ketimbang tingkah laku yang diperoleh dalam penguatan berkelanjutan.
Dalam eksperimen lainnya, Skinner (1958) melatih merpati untuk memainkan sejenis tenis meja (http://www.youtube.com/watch?v=vGazyH6fQQ4) dengan proses yang dinamakan “pembentukan” (shaping). Pertama, merpati dihadiahi ketika menunjukkan tindakan yang samar-samar mendekati (approximate) tingkah laku sasaran. Selanjutnya hadiah dibatasi pada tindakan yang lebih dekat sesuai dengan tingkah laku sasaran. Secara gradual tingkah laku merpati “terbentuk” (shaped) sampai dengan terjadi tingkah laku yang memenuhi sasaran. Ringkasan peristilahan kunci yang digunakan dalam pengkondisian operan disajikan dalam Tabel 12.
Istilah
Penjelasan
Pengkondisian operan
Proses pembentukan tingkah laku dengan menyusulkan sebuah tingkah laku dengan penguat yang meningkat frekuensinya.
Penguatan
Sebuah peristiwa yang meningkatkan probabilitas bahwa peristiwa yang mendahului penguatan itu akan diulang.
Penguatan kontinu
Sebuah pola dalam mana setiap respons yang diinginkan diikuti oleh penguatan.
Penguatan variabel
Sebuah pola dalam mana hanya sejumlah respons yang diinginkan yang disusuli oleh penguatan.
Magnitud
Sebuah istilah yang mendeskripsikan skala penguat yang besar dan menarik yang dapat menghasilkan pembelajaran respons yang lebih cepat.
Repetisi
Frekuensi tingkah laku operan yang telah diperkuat, yang memperkuat asosiasi antara stimulus dan respons.
Ekstingsi
Peniadaan tingkah laku dengan menghapus penguatan.
Pembentukan
Proses menguatkan tingkah laku sehingga menjadi tingkah laku yang lebih menyerupai tingkah laku target.
Tabel 12. Istilah kunci dalam pengkondisian operan
Perkembangan Gagasan dalam Behaviorisme
Thorndike telah menggambarkan pembelajaran binatang dalam konteks coba-salah. Para teoris Gestalt seperti Wolfgang Köhler (1925) menyajikan kera dengan masalah yang melibatkan makanan yang tak terjangkau oleh tangan kera. Kera dapat memecahkan masalah tersebut melalui proses insight kognitif tiba-tiba ketimbang dengan coba-salah yang sederhana (Davey, 2004). Pada pertengahan abad ke-20, muncul pengakuan bahwa pengkondisian melibatkan pula elemen kognitif. Neo-behavioris mengakui bahwa pengkondisian operan dan klasik tidak secara sempurna menentukan tingkah laku. Sebagai contoh, psikolog Amerika Edwin Chace Tolman menunjukkan bahwa tikus dapat melampaui tingkah laku sederhana stimulus-respons serta dapat belajar, mengingat, dan menggunakan fakta-fakta mengenai sebuah labirin (Tolman, dkk., 1946). Tolman mendeskripsikan pengkodean (coding), penyimpanan (storing), dan pengaksesan (accessing) mental terhadap informasi spasial dan informasi lainnya tersebut sebagai “peta kognitif” (cognitive map) (Tolman, 1948). Namun demikian, pada waktu itu penelitian ini gagal memberikan pengaruh yang besar karena kaum behavioris seperti Skinner berargumentasi bahwa mempelajari tingkah laku lebih berguna daripada menyelidiki kondisi-kondisi mental.