Impor data menggunakan R di Power BI

Dalam artikel ini, kita akan mempelajari cara mengonfigurasi Power BI agar berfungsi dengan R dan sumber set data yang diperlukan darinya untuk pelaporan di Laporan Power BI.

pengantar

Dalam praktik ilmu data, banyak kerangka kerja menawarkan berbagai fungsi untuk berbagai bidang ilmu data. Dari banyak kerangka kerja ilmu data ini, dua kerangka kerja yang menjadi pemimpin di bidang ini adalah R dan Python. Adopsi dan popularitas kerangka kerja ini sangat besar sehingga banyak alat telah membuka integrasi dengan kerangka kerja ini. Dalam alat rekayasa data modern, hampir di sepanjang jalur data mulai dari pengumpulan data hingga konsumsi data, R dan Python dapat digunakan di setiap lompatan data dalam proses ujung ke ujung. Contoh area di mana R dan Python dapat digunakan adalah pipeline ETL, pemrosesan batch menggunakan kerangka kerja seperti Hadoop, rendering visualisasi dalam laporan, dan banyak lagi. Mesin inti dari kerangka kerja ilmu data adalah perpustakaan yang digunakan dengan kerangka kerja ini dan kumpulan data yang digunakan dengannya. Secara umum, setiap latihan ilmu data dimulai dengan analisis data eksplorasi yang menggunakan sampel data dan kemudian bagian utama dari latihan ini adalah menyempurnakan kumpulan data ini untuk membuatnya seakurat mungkin sehingga pembelajaran mesin atau model kecerdasan buatan dapat menyimpulkan dari kumpulan data yang disaring ini. Meskipun kerangka kerja ini bukan basis data yang menampung data dan struktur data, tetapi kumpulan data yang dibuat oleh ilmuwan data serta kumpulan data sampel yang dikirimkan bersama ribuan pustaka yang digunakan dalam kerangka kerja ini, menjadikannya sebagai sumber data. Ini berarti kerangka kerja seperti R menjadi sumber data, yang mungkin perlu dilaporkan pada waktu-waktu tertentu untuk berbagai tujuan. Alat pelaporan seperti Power BI menyediakan opsi untuk sumber data dari kerangka kerja seperti R dan merendernya pada laporan PowerBI.

Instalasi dan Pengaturan R

Kami akan menggunakan R sebagai sumber data untuk laporan Power BI. Jadi, kami memiliki dua prasyarat dalam hal ini, pengaturan R dan pengaturan PowerBI pada mesin yang sama. Diasumsikan bahwa versi terbaru PowerBI sudah diinstal pada mesin pengembangan. Meskipun pengembang laporan mungkin familiar dengan penginstalan PowerBI, beberapa mungkin baru dalam penginstalan dan penyiapan R. Ada dua cara yang dapat digunakan untuk menyetel dan mengonfigurasi R pada mesin lokal. Cara pertama dan paling mudah untuk menginstal R adalah dengan mengunduh R dari situs resminya. Ini menginstal pengaturan R di lokasi pilihan dan menetapkan jalur penginstalan R dalam variabel jalur.

Pendekatan lain untuk menginstal R adalah dengan memilih komponen yang relevan dalam instalasi SQL Server. Power BI dan SQL Server keduanya merupakan bagian dari tumpukan teknologi Microsoft dan umumnya, bekerja sama untuk penyimpanan dan pelaporan data. Jika Anda telah menginstal Microsoft SQL Server di mesin lokal, Anda dapat mempertimbangkan untuk menambahkan R di bagian fitur berbagi dan menginstalnya sebagai bagian dari instalasi SQL Server. Setelah diinstal, Anda akan menemukannya di direktori bernama R Server seperti yang ditunjukkan di bawah ini. Seseorang dapat menggunakan pengaturan R ini dengan PowerBI serta dengan mesin database SQL Server. Mekanisme berbagi penginstalan R dengan SQL Server dan PowerBI ini membantu dalam menggunakan pustaka umum dan kumpulan data dengan mulus menggunakan penginstalan R bersama.


Diasumsikan bahwa setidaknya satu instalasi R tersedia di mesin yang sama tempat PowerBI diinstal.

Sekarang R diinstal pada mesin lokal, sekarang saatnya untuk mengonfigurasi alat Power BI Desktop untuk menunjuk ke instalasi R ini. Buka PowerBI, klik menu File -> Opsi dan Pengaturan -> Menu Opsi -> item menu R Scripting. Ini akan membuka halaman yang relevan dengan konfigurasi R Scripting di PowerBI. Secara default, direktori R Home Terdeteksi mungkin tidak memiliki nilai apa pun. Klik pada drop-down dan arahkan ke jalur instalasi direktori R Home. Setelah selesai, itu akan menunjukkan jalur direktori home seperti yang ditunjukkan di bawah ini.


Konfigurasi Power BI

Jika kita menggunakan setup R yang diinstal menggunakan Microsoft SQL Server, beberapa library dasar sudah diinstal. Dalam beberapa kasus, kita mungkin harus menginstal beberapa pustaka dasar jika pengaturan khusus atau kustom dari R diinstal. Untuk saat ini, kami akan berasumsi bahwa penginstalan R dengan pustaka yang memadai telah diinstal dan dikonfigurasi untuk digunakan dengan Power BI.

Mengimpor data dari R dapat dilakukan dengan dua cara. R itu sendiri adalah kerangka pemrosesan dan pemrograman data, sehingga memungkinkan pengimporan data dari berbagai sumber data menggunakan skrip R. PowerBI sendiri mendukung lebih dari seratus konektor untuk sumber data langsung di laporan PowerBI. Terkadang, analis data atau ilmuwan data membuat skrip yang menjadi sumber data dan memprosesnya juga menggunakan skrip R. Seseorang mungkin ingin menggunakan kembali skrip tersebut untuk melanjutkan sumber data dengan cara yang konsisten tanpa perlu menyusun data tersebut dalam repositori sementara untuk sumbernya di PowerBI. Untuk kasus penggunaan seperti itu, PowerBI menyediakan opsi untuk mengeksekusi R Script menggunakan konektor R Script, yang mengeksekusi skrip menggunakan pengaturan R yang telah kami tunjukkan pada alat Power BI Desktop sebelumnya. Katakanlah kita bermaksud mengimpor data dari file yang dihosting di GitHub. Dengan menggunakan satu baris kode, kami akan dapat mengambil data dari file semacam itu. Prasyarat untuk sumber data menggunakan konektor R adalah bahwa output harus berupa bingkai data, hanya kemudian akan bersumber di PowerBI.

Klik pada item menu Get Data dan pilih konektor R Script. Itu akan membuka dialog baru untuk menentukan skrip R. Tambahkan skrip seperti yang ditunjukkan di bawah ini untuk membaca data dari file CSV yang dihosting di GitHub.


Membaca file dari Github

Klik pada Oke tombol, dan kemudian Power BI akan mencoba menjalankan skrip ini menggunakan penginstalan R. Jika eksekusi skrip berhasil, data yang diekstraksi akan ditampilkan pada halaman pratinjau seperti yang ditunjukkan di bawah ini. Ini berarti berhasil mendapatkan sumber data. Kami juga memiliki opsi untuk mengubah data ini dalam penerbangan sebelum dimuat dalam laporan.


Sumber data menggunakan R

Kasus penggunaan lain dalam mengimpor data dari penginstalan R adalah untuk mengambil sampel kumpulan data yang dikirimkan bersama pustaka yang diinstal atau kumpulan data yang dibuat sebagai output dari mengeksekusi skrip tertentu di R. Kumpulan data tersebut dapat bersumber dari R hanya dengan menggunakan skrip R konektor di Power BI. Salah satu kumpulan data paling populer yang banyak digunakan oleh para profesional data yang bekerja dengan R adalah kumpulan data berlian yang disertakan dengan perpustakaan ggplot2. Mungkin, perpustakaan ini tidak akan diinstal secara default. Seseorang dapat menavigasi ke R yang dapat dieksekusi, dan menjalankan perintah install.packages(“ggplot2”) untuk menginstal pustaka ini dengan dependensi terkaitnya. Kami akan menggunakan perpustakaan ini dalam contoh yang akan datang dan diasumsikan bahwa perpustakaan ini sudah diinstal pada pengaturan R Anda.

Ulangi langkah-langkah yang ditunjukkan di atas dan masukkan skrip seperti yang ditunjukkan di bawah ini. Di sini kita mengimpor perpustakaan ggplot2 di skrip kita pada langkah pertama. Pada langkah selanjutnya, kita menunjuk ke dataset berlian menggunakan fungsi data.


R Script ke sumber dataset dari R

Jika skrip berhasil dieksekusi, kami akan dapat melihat data pada halaman pratinjau seperti yang ditunjukkan di bawah ini.


Kumpulan Data Berlian

Dengan cara ini, hanya dengan beberapa baris kode dan menggunakan konektor R Script, kita dapat mulai mengambil data dari dan melalui penginstalan R untuk digunakan dengan laporan Power BI.

Kesimpulan

Pada artikel ini, pertama-tama kita mempelajari cara menginstal R secara langsung serta dengan instalasi SQL Server. Kami mengonfigurasi alat Power BI Desktop untuk menunjuk ke penginstalan R, dan kemudian kami mempelajari cara menggunakan konektor R dan skrip untuk sumber data dari R serta dari sumber lain menggunakan R.

Gauri Mahajan
Postingan terbaru oleh Gauri Mahajan (Lihat semua)

Pemulihan Data