{"id":2529,"date":"2023-04-06T19:32:15","date_gmt":"2023-04-06T12:32:15","guid":{"rendered":"https:\/\/student-activity.binus.ac.id\/himmat\/?p=2529"},"modified":"2023-04-06T19:33:25","modified_gmt":"2023-04-06T12:33:25","slug":"sejarah-dari-generative-pre-trained-transformer-gpt","status":"publish","type":"post","link":"https:\/\/student-activity.binus.ac.id\/himmat\/2023\/04\/sejarah-dari-generative-pre-trained-transformer-gpt\/","title":{"rendered":"Sejarah dari Generative Pre-trained Transformer (GPT)"},"content":{"rendered":"<p style=\"text-align: justify\"><span style=\"font-weight: 400\"><a href=\"http:\/\/student-activity.binus.ac.id\/himmat\/wp-content\/uploads\/sites\/14\/2023\/04\/gpt-4jpg-20230315053400.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-2530\" src=\"http:\/\/student-activity.binus.ac.id\/himmat\/wp-content\/uploads\/sites\/14\/2023\/04\/gpt-4jpg-20230315053400.jpg\" alt=\"\" width=\"1200\" height=\"667\" \/><\/a><br \/>\n30 November 2022 merupakan sebuah tanggal yang bersejarah untuk perkembangan <\/span><i><span style=\"font-weight: 400\">Artificial Intelligence<\/span><\/i><span style=\"font-weight: 400\"> di dunia komputer. <\/span><i><span style=\"font-weight: 400\">ChatGPT<\/span><\/i><span style=\"font-weight: 400\">, sebuah <\/span><i><span style=\"font-weight: 400\">chatbot<\/span><\/i><span style=\"font-weight: 400\"> yang menggunakan <\/span><i><span style=\"font-weight: 400\">AI<\/span><\/i><span style=\"font-weight: 400\"> dari <\/span><i><span style=\"font-weight: 400\">OpenAI<\/span><\/i><span style=\"font-weight: 400\">, pertama kali diluncurkan kepada publik pada tanggal tersebut. Dalam beberapa hari saja, sudah ada sekitar 1 juta orang yang memakai <\/span><i><span style=\"font-weight: 400\">ChatGPT<\/span><\/i><span style=\"font-weight: 400\">. Kemunculannya pun membuat banyak perusahaan mulai ikut terjun ke dunia <\/span><i><span style=\"font-weight: 400\">Chatbot<\/span><\/i><span style=\"font-weight: 400\"> ini, mulai dari <\/span><i><span style=\"font-weight: 400\">Microsoft<\/span><\/i><span style=\"font-weight: 400\"> yang menggaet <\/span><i><span style=\"font-weight: 400\">OpenAI <\/span><\/i><span style=\"font-weight: 400\">untuk membuat <\/span><i><span style=\"font-weight: 400\">BingAI<\/span><\/i><span style=\"font-weight: 400\">, sampai <\/span><i><span style=\"font-weight: 400\">Google<\/span><\/i><span style=\"font-weight: 400\"> pun juga meluncurkan <\/span><i><span style=\"font-weight: 400\">Bard<\/span><\/i><span style=\"font-weight: 400\"> pada bulan Maret 2023. Namun, perkembangan ini tidak terjadi hanya dalam 1 malam saja, terdapat berbagai tahapan yang harus dilakukan untuk merangkai <\/span><i><span style=\"font-weight: 400\">ChatGPT<\/span><\/i><span style=\"font-weight: 400\">.<\/span><\/p>\n<p style=\"text-align: justify\">\n<p style=\"text-align: justify\"><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\"> atau <\/span><i><span style=\"font-weight: 400\">Generative Pre-trained Transformer <\/span><\/i><span style=\"font-weight: 400\">merupakan sebuah model bahasa besar yang diperkenalkan oleh <\/span><i><span style=\"font-weight: 400\">OpenAI<\/span><\/i><span style=\"font-weight: 400\"> pada tahun 2018. <\/span><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\"> merupakan jaringan saraf tiruan yang berdasarkan arsitektur transformer, yang dilatih tanpa pengawasan pada kumpulan data besar tanpa label.. Teknik ini berbeda dengan teknologi yang sudah ada saat itu, dimana teknologi yang lain menggunakan pelatihan dengan pengawasan dari data-data yang dilabeli secara manual. <\/span><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\"> terdiri dari 4 iterasi, mulai dari <\/span><i><span style=\"font-weight: 400\">GPT-1 <\/span><\/i><span style=\"font-weight: 400\">hingga <\/span><i><span style=\"font-weight: 400\">GPT-4<\/span><\/i><span style=\"font-weight: 400\">.<\/span><\/p>\n<p style=\"text-align: justify\">\n<p style=\"text-align: justify\"><span style=\"font-weight: 400\">Model pertama dari <\/span><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\"> adalah <\/span><i><span style=\"font-weight: 400\">GPT-1<\/span><\/i><span style=\"font-weight: 400\">. Diluncurkan pada 11 Juni 2018, <\/span><i><span style=\"font-weight: 400\">GPT-1<\/span><\/i><span style=\"font-weight: 400\"> dilatih menggunakan 2 tahapan yang disebut <\/span><i><span style=\"font-weight: 400\">\u201cSemi-Supervised\u201d<\/span><\/i><span style=\"font-weight: 400\"> atau semi diawasi. Tahapan pertama adalah pelatihan awal yang tidak diawasi yang berguna untuk mendapat parameter awal. Lalu yang kedua adalah penyetelan halus yang diawasi untuk mengadaptasikan parameter yang sudah terbentuk kepada target tugasnya. <\/span><i><span style=\"font-weight: 400\">GPT-1<\/span><\/i><span style=\"font-weight: 400\"> menggunakan dataset dari <\/span><i><span style=\"font-weight: 400\">BookCorpus<\/span><\/i><span style=\"font-weight: 400\"> yang berisikan 7000 buku berukuran 4.5 <\/span><i><span style=\"font-weight: 400\">GB<\/span><\/i><span style=\"font-weight: 400\"> yang tidak dipublikasikan dan memakai struktur transformator khusus dekoder 12 lapis dengan <\/span><i><span style=\"font-weight: 400\">masked self-attention <\/span><\/i><span style=\"font-weight: 400\">untuk melatih kebahasaannya. Terdapat 117 juta parameter di <\/span><i><span style=\"font-weight: 400\">GPT-1<\/span><\/i><span style=\"font-weight: 400\">.<\/span><\/p>\n<p style=\"text-align: justify\">\n<p style=\"text-align: justify\"><span style=\"font-weight: 400\">Model kedua dari <\/span><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\"> adalah <\/span><i><span style=\"font-weight: 400\">GPT-2<\/span><\/i><span style=\"font-weight: 400\">. Diluncurkan pada 14 Februari 2019, <\/span><i><span style=\"font-weight: 400\">GPT-2 <\/span><\/i><span style=\"font-weight: 400\">menggunakan arsitektur yang sudah dimodifikasi dari <\/span><i><span style=\"font-weight: 400\">GPT-1<\/span><\/i><span style=\"font-weight: 400\"> dan menggunakan dataset dan parameter yang jauh lebih banyak dibanding <\/span><i><span style=\"font-weight: 400\">GPT-1<\/span><\/i><span style=\"font-weight: 400\">. <\/span><i><span style=\"font-weight: 400\">GPT-2<\/span><\/i><span style=\"font-weight: 400\"> dilatih dengan teknik yang sama, namun <\/span><i><span style=\"font-weight: 400\">GPT-2<\/span><\/i><span style=\"font-weight: 400\"> berlatih dengan beberapa tugas secara bersamaan. <\/span><i><span style=\"font-weight: 400\">GPT-2<\/span><\/i><span style=\"font-weight: 400\"> menggunakan dataset dari <\/span><i><span style=\"font-weight: 400\">WebText<\/span><\/i><span style=\"font-weight: 400\"> yang memiliki ukuran 40 <\/span><i><span style=\"font-weight: 400\">GB<\/span><\/i><span style=\"font-weight: 400\"> yang berisikan 8 juta dokumen, yang membuat <\/span><i><span style=\"font-weight: 400\">GPT-2<\/span><\/i><span style=\"font-weight: 400\"> memiliki 1.5 miliar parameter.<\/span><\/p>\n<p style=\"text-align: justify\">\n<p style=\"text-align: justify\"><span style=\"font-weight: 400\">Pada 11 Juni 2020, model ketiga <\/span><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\">, yaitu <\/span><i><span style=\"font-weight: 400\">GPT-3<\/span><\/i><span style=\"font-weight: 400\"> diluncurkan. <\/span><i><span style=\"font-weight: 400\">GPT-3<\/span><\/i><span style=\"font-weight: 400\"> masih menggunakan arsitektur yang sama, namun dimodifikasi agar mampu mengakomodasi peningkatan dataset dan parameter. Betul saja, peningkatan <\/span><i><span style=\"font-weight: 400\">GPT-3<\/span><\/i><span style=\"font-weight: 400\"> dari <\/span><i><span style=\"font-weight: 400\">GPT-2<\/span><\/i><span style=\"font-weight: 400\"> sungguh pesat. Terdapat 175 miliar parameter di GPT-3 ini. Dataset yang diambil pun sangat besar, yaitu tulisan sebesar 570 <\/span><i><span style=\"font-weight: 400\">GB<\/span><\/i><span style=\"font-weight: 400\"> yang terdiri dari <\/span><i><span style=\"font-weight: 400\">Wikipedia<\/span><\/i><span style=\"font-weight: 400\">, <\/span><i><span style=\"font-weight: 400\">CommonCrawl<\/span><\/i><span style=\"font-weight: 400\">, <\/span><i><span style=\"font-weight: 400\">Webtext<\/span><\/i><span style=\"font-weight: 400\">, <\/span><i><span style=\"font-weight: 400\">Books1<\/span><\/i><span style=\"font-weight: 400\">, dan <\/span><i><span style=\"font-weight: 400\">Books2<\/span><\/i><span style=\"font-weight: 400\">. <\/span><i><span style=\"font-weight: 400\">GPT-3<\/span><\/i><span style=\"font-weight: 400\"> mampu membuat kerjaan yang bahkan sulit dibedakan apakah pekerjaan itu dibuat oleh <\/span><i><span style=\"font-weight: 400\">AI<\/span><\/i><span style=\"font-weight: 400\"> atau manusia. <\/span><i><span style=\"font-weight: 400\">GPT-3<\/span><\/i><span style=\"font-weight: 400\"> ini sendiri lalu diperbaiki kembali menjadi <\/span><i><span style=\"font-weight: 400\">GPT-3.5<\/span><\/i><span style=\"font-weight: 400\">, yang dilatih dengan <\/span><i><span style=\"font-weight: 400\">RLHF<\/span><\/i><span style=\"font-weight: 400\"> (<\/span><i><span style=\"font-weight: 400\">Reinforcement Learning from Human Feedback<\/span><\/i><span style=\"font-weight: 400\">). <\/span><i><span style=\"font-weight: 400\">GPT-3.5<\/span><\/i><span style=\"font-weight: 400\"> inilah yang dipakai oleh <\/span><i><span style=\"font-weight: 400\">ChatGPT<\/span><\/i><span style=\"font-weight: 400\">.<\/span><\/p>\n<p style=\"text-align: justify\"><i><span style=\"font-weight: 400\">GPT-4<\/span><\/i><span style=\"font-weight: 400\"> merupakan versi terkini dari keluarga <\/span><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\">. Diluncurkan pada 14 Maret 2023, <\/span><i><span style=\"font-weight: 400\">GPT-4<\/span><\/i><span style=\"font-weight: 400\"> merupakan babak baru dari perkembangan <\/span><i><span style=\"font-weight: 400\">GPT<\/span><\/i><span style=\"font-weight: 400\">. Untuk pertama kalinya, GPT-4 mampu menerima <\/span><i><span style=\"font-weight: 400\">input<\/span><\/i><span style=\"font-weight: 400\"> dalam bentuk gambar. Sayangnya, tidak ada detail yang diberikan tentang jumlah parameter dan apa dataset yang dipakai. Namun, <\/span><i><span style=\"font-weight: 400\">GPT-4<\/span><\/i><span style=\"font-weight: 400\"> telah terbukti jauh lebih mampu melakukan tugasnya dibanding <\/span><i><span style=\"font-weight: 400\">GPT-3.5<\/span><\/i><span style=\"font-weight: 400\">. Terbukti bahwa<\/span><i><span style=\"font-weight: 400\"> GPT-4<\/span><\/i><span style=\"font-weight: 400\"> mampu mengerjakan banyak ujian dengan hasil yang bisa dibilang memuaskan. Menarik untuk disimak bagaimana perkembangan lebih lanjut dari <\/span><i><span style=\"font-weight: 400\">GPT-4<\/span><\/i><span style=\"font-weight: 400\">.<\/span><\/p>\n<p style=\"text-align: justify\">Referensi:<br \/>\nhttps:\/\/en.wikipedia.org\/wiki\/Generative_pre-trained_transformer<\/p>\n<p>https:\/\/cdn.openai.com\/research-covers\/language-unsupervised\/language_understanding_paper.pdf<\/p>\n<p>https:\/\/en.wikipedia.org\/wiki\/ChatGPT<\/p>\n<p>https:\/\/medium.com\/walmartglobaltech\/the-journey-of-open-ai-gpt-models-32d95b7b7fb2<\/p>\n<p>https:\/\/asset-a.grid.id\/crop\/0x0:0x0\/x\/photo\/2023\/03\/15\/gpt-4jpg-20230315053400.jpg<\/p>\n","protected":false},"excerpt":{"rendered":"<p>30 November 2022 merupakan sebuah tanggal yang bersejarah untuk perkembangan Artificial Intelligence di dunia komputer. ChatGPT, sebuah chatbot yang menggunakan AI dari OpenAI, pertama kali diluncurkan kepada publik pada tanggal tersebut. Dalam beberapa hari saja, sudah ada sekitar 1 juta orang yang memakai ChatGPT. Kemunculannya pun membuat banyak perusahaan mulai ikut terjun ke dunia Chatbot [&hellip;]<\/p>\n","protected":false},"author":15,"featured_media":2530,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[98,22,97],"class_list":["post-2529","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-articles","tag-ai","tag-artificial-intelligence","tag-chatgpt"],"_links":{"self":[{"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/posts\/2529","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/users\/15"}],"replies":[{"embeddable":true,"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/comments?post=2529"}],"version-history":[{"count":2,"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/posts\/2529\/revisions"}],"predecessor-version":[{"id":2532,"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/posts\/2529\/revisions\/2532"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/media\/2530"}],"wp:attachment":[{"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/media?parent=2529"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/categories?post=2529"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/student-activity.binus.ac.id\/himmat\/wp-json\/wp\/v2\/tags?post=2529"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}