EduKonten.com – Halo sobat edu konten. Gimana nih, udah tertarik belum menjadi seorang data scientist? Nah bagi kalian yang tertarik, sebelumnya kalian harus tau nih 4 tools yang harus kalian kuasai sebagai seorang data scientist pemula.
1. R

R merupakan sebuah tools sekaligus bahasa pemrograman yang paling banyak digunakan untuk komputasi statistik, visualisasi data, dan juga data science. R menyediakan berbagai teknik analisis statistik dan grafik, sehingga banyak digunakan oleh para data scientist maupun ahli statistik.
Salah satu alasan R banyak digunakan adalah sifatnya yang open source (gratis) dan kompatible di banyak OS, seperti Windows, MacOS, UNIX, dan juga Linux. Berikut beberapa alasan lain mengapa R banyak di gunakan untuk pengolahan data :
- Lebih mudah untuk dipelajari
- Memiliki berbagai fitur yang membantu proses pengolahan data
- Bekerja dengan lebih cepat
- Banyak digunakan oleh berbagai perusahaan besar, seperti Google, Facebook, Shell, Merck, Pfizer, Linkedln, dsb.
2. SQL

SQL (Structured Query Language) merupakan bahasa pemrograman standar yang berfungsi untuk mengelola database relasional dan melakukan berbagai operasi pada data yang terdapat di dalamnya. Bagi yang belum tau, database itu merupakan kumpulan data yang saling berkaitan dan tersimpan secara sistematis.
Berikut beberapa hal yang dapat dilakukan dengan menggunakan SQL :
- modifikasi table database dan indeks struktur
- menambahkan, mengupdate, dan menghapus se-baris data
- mengambil sub informasi dari dalam sistem manajemen database relasional (RDBMS)
3. Python

Python merupakan bahasa pemrogman open source, terinterpretasi, dan high level language yang menyediakan pendekatan bagus untuk OOP (pemrograman berorientasi objek). Python merupakan salah satu tools terbaik yang digunakan para data scientist untuk berbagai projek maupun aplikasi dari data science.
Python menyediakan berbagai fungsi yang berkaitan dengan matematika, statistik, maupun fungsi ilmiah. Selain itu, python juga menyediakan berbegai librari yang sangat cocok digunakan untuk hal yang berurusan dengan aplikasi data science.
4. Tools Visualisasi Data

Data visualisasi merupakan proses pelaporan hasil analisis data ke dalam bentuk tampilan grafis atau visual. Data visualisasi ini dilakukan agar data lebih mudah di pahami oleh banyak orang, dan sekaligus mempermudah komunikasi antar stokeholder.
Terdapat berbagai tools visualisasi data, dimulai dari yang gratis hingga berbayar. Berikut beberapa contoh tools visualisasi data yang biasa di gunakan :
- Tableu (open source)
- Microsoft Power BI (berbayar)
- Plotly (open source)
- FusionCharts (berbayar)