EduKonten.com – Halo sobat Edu Konten!! Kembali lagi ke pembahasan kita mengenai Data Science. Pada artikel kali ini, kita akan membahas mengenai pengertian, manfaat, dan keuntungan penggunaan bahasa R untuk Data Science. Stay tuned!!
Apa sih yang dimaksud dengan bahasa R?
Bahasa pemrograman R merupakan bahasa yang dibuat berdasarkan bahasa S pada komputasi statistical. Bahasa ini pertama kali di buat oleh Ross Ihaka dan Robert Gentlemen di Dapartmen of Statistics Universitas Auckland. Bahasa R di buat untuk mengatasi kelemahan dari Bahasa S, yaitu hanya tersedia dalam pakacge komersial.
Bahasa R kemudian baru dipublikasikan pada awal tahun 1993. Salah seorang yang berperan dalam pengembangan R adalah Martin Machler, yang mengusulkan untuk menggunakan GNU General Publik License untuk membuat R sebagai free software. Sehingga source code untuk R dapat di akses oleh semua orang yang ingin mengembangkannya.
Berbagai kalangan yang kemudian bergabung dalam proses pengembangan R (R-help dan R-devel list) membentuk grup yang diberi nama R Core Group pada tahun 1997. Akhirnya setelah melalui beberapa pengembangan, R versi 1.0.0 mulai di rilis di publik pada tahun 2000.
Mengapa Menggunakan Bahasa R dalam Pengolahan Data?
Berikut beberapa alasan mengapa Bahasa R sangat populer digunakan oleh data scientist:
1. Open Source
Salah satu kelebihan dari R adalah Open Source. Sehingga, memungkinkan semua orang untuk menggunakan nya secara gratis. R juga dapat di jalankan di berbagai platform, seperti Windows, Mac, dan Linux.
2. Visualisasi Data
R telah di lengkapi oleh library yang menyediakan visualisasi data. Fitur visualisasi data di R merupakan salah satu yang terbaik di kelasnya. Visualisasi data yang di tampilkan bersifat estetik serta berwawasan luas. Beberapa librari visualisasi data pada R adalah ggplot2, plotly, dplyr, dan tidyr.
3. Data Wrangling
Data wrangling merupakan proses pengumpulan data yang sesuai untuk kebutuhan analisis, serta mengubahnya menjadi bentuk yang dapat di gunakan. Proses ini di butuhkan dalam proses analisis data. Untungnya R menyediakan berbagai package yang dapat digunakan untuk exploration dan transformation data. Beberapa contoh package tersebut adalah dplyr, purrr, readxl, datapaste, jsonlite, dan tidyr.
4. Support for Extensions
Sifat R yang open-source memungkinkan adanya modifikasi di berbagai library yang di sediakan, bahkan memungkinkan pembuatan library yang baru sesuai dengan kebutuhan. Walaupun sebenarnya R sendiri sudah di lengkapi dengan berbagai library.
5. Dukungan Komunitas yang Luas
R didukung dengan komunitas yang luas dan sangat membantu untuk semua pengguna. Hal ini merupakan hal yang baik bagi para pemula yang baru ingin mempelajari R. Perkembangan R yang pesat selain dikarenakan oleh sifatnya yang open-source, juga sangat dipengaruhi oleh konstribusi dari berbagai komunitas.
6. Mudah Dipahami
Apabila kalian sudah familiar dengan statistika, maka kalian akan sangat terbantu dalam memahami dan menggunakan R. Hal ini di karenakan R di rancang untuk memfasilitasi ahli statistik. Pemrograman R di buat untuk mempermudah Data Science.
Apakah Ada Bahasa Selain R yang Digunakan Dalam Data Science?
Ya, tentu saja ada. Dalam proses pengolahan data, seorang scientist selain menggunakan R bisa juga menggunakan Python, maupun Matlab.
Tentu saja pemilihan bahasa programan tergantung kepada scientist masing – masing. Untuk saat ini, kita akan membahas mengenai bahasa R saja.