Dalam pembahasan komunikasi berorientasi koneksi, aliran data adalah proses pengkodean dan transmisi data secara terus menerus (kontinu)[1]. Data berisi deskripsi kejadian (event) digital ditransmisikan melalui sinyal yang mengalami proses dekode secara digital untuk menyampaikan informasi.[2] Biasanya, karakter yang ditransmisikan dikelompokkan menjadi beberapa paket.[3]

Pengaliran data (data streaming) sudah umum terjadi. Berkas apapun yang dikirimkan melalui layanan Internet ditransmisikan sebagai aliran data. Sebagai contoh, percakapan yang dilakukan melalui telepon genggam, mentransmisikan data suara melalui aliran data.

Definisi formal matematika

sunting

Dalam perspektif formal matematis, aliran data adalah pasangan terurut apa pun dalam notasi di mana:

  1. adalah urutan tupel dan
  2. (delta) adalah urutan interval waktu dalam bilangan riil bersifat positif.

Konten isi aliran data

sunting

Aliran data berisi kumpulan data yang berbeda, yang bergantung pada format data, yaitu:

  • Atribut – tiap atribut dari aliran data yang merepresentasikan tipe data tertentu, seperti ID segmen/titik data, stempel waktu, geodata.[1]
  • Stempel waktu mengidentifikasikan kapan suatu peristiwa dalam atau pada data terjadi.
  • ID subjek dari proses pengkodean oleh algoritma, diekstraksi dari kuki sistem.
  • Data mentah mencakup informasi langsung dari sumber data tanpa diproses oleh algoritma atau manusia.
  • Data yang diproses adalah data yang telah disiapkan (melalui proses modifikasi, validasi, atau pembersihan), untuk digunakan nanti.

Penggunaan aliran data

sunting

Ada berbagai area di mana aliran data digunakan, diantaranya:

  • Deteksi & pemberian skor dalam kasus penipuan – data mentah digunakan sebagai sumber data untuk algoritma anti-penipuan. Misalnya, stempel waktu, data kuki, atau analisis titik data digunakan dalam sistem skor untuk mendeteksi kasus penipuan atau untuk memastikan bahwa penerima transmisi pesan bukanlah bot (Lalu Lintas Non-Manusia[4]).
  • Kecerdasan buatan – data mentah dijadikan data latih dan data uji selama pelatihan algoritma kecerdasan buatan dan pembelajaran mesin .
  • Data mentah dapat digunakan untuk personalisasi layanan pengguna [5] dan untuk segmentasi pengguna, seperti, per jenis kelamin maupun lokasi pengguna.
  • Inteligensi bisnis – data mentah adalah sumber informasi untuk sistem inteligensi bisnis, yang menggunakan data pengguna untuk membangun profil pengguna, misalnya, kebiasaan belanja atau geodata. Informasi ini digunakan untuk analisis bisnis dan penelitian prediktif.
  • Pembuatan target pada media sosial – data yang diproses oleh ilmuwan data untuk meningkatkan kampanye daring dan digunakan untuk menjangkau audiens yang dituju.[6]
  • Pengayaan CRM – data mentah diintegrasikan dengan sistem manajemen hubungan pelanggan (CRM). Integrasi CRM memungkinkan untuk mengatasi kesenjangan profil pengguna dengan data demografi, minat, atau niat pembelian.

Integrasi aliran data

sunting

Integrasi utama dengan aliran data adalah, antara lain:

  • Aliran data terintegrasi dengan sistem informasi seperti platform data pelanggan (customer data platform/CDP), manajemen hubungan pelanggan (customer relationship management/CRM) atau platform manajemen data (data management platform/DMP) untuk memperkaya profil pengguna dengan bantuan data dari eksternal sistem. Pengetahuan sistem tentang pengguna dapat diperluas dengan menggunakan sumber eksternal.[7]
  • Aliran data digunakan untuk memperkaya sistem inteligensi bisnis dan membuat analisis dan kesimpulan menjadi lebih akurat.
  • Pada integrasi di sistem manajemen konten (content management system/CMS), aliran data digunakan untuk mengidentifikasi pengguna dan mempersonalisasi layanan untuk pengguna sejak kunjungan pertama mereka pada sistem. Dengan analisis data, konten yang ditampilkan disesuaikan dengan preferensi pengguna.

Sumber aliran data yang dapat dilihat

sunting

Pada log aliran data dapat terlihat perangkat apa yang telah digunakan oleh sisi pengguna, seperti:

  • seluler – saat pengguna menggunakan peramban seluler untuk penjelajahan, aliran data mencatat resolusi layar dan versi aplikasi seluler;
  • desktop – saat pengguna menggunakan peramban desktop atau versi aplikasi.

Informasi berikut dibagikan dari perangkat yang digunakan:

Selain itu, terdapat beberapa format lain yang digunakan aliran data:

  • Segmen (segment) adalah pernyataan logis, yang dibangun pada titik data tertentu menggunakan operator AND, OR, atau NOT.[8]
  • Data hibrida – data mentah dari format data titik data dan segmen.[9]
  • URL – adalah sekumpulan informasi tentang URL tertentu yang telah dikunjungi.

Aliran data dan regulasi umum perlindungan data (GDPR)

sunting

Informasi yang terkumpul dari situs web adalah data yang dihasilkan dari tangkapan perilaku pengguna. Pengguna selaku penyedia data menyampaikan informasi pribadi dan non-pribadi. Ada dua jenis data pengguna yang digunakan dalam aliran data:

  • Informasi data pribadi (Personally identifiable information/PII) – informasi yang mdapat secara langsung mengidentifikasi seseorang. Contoh PII adalah: ID asuransi, alamat surel, nomor telepon, alamat IP, geolokasi, data biometrik.[10]
  • Informasi selain data pribadi (non-PII) adalah informasi yang tidak dapat digunakan untuk mengidentifikasi seseorang atau melacak lokasi. Data kuki atau ID perangkat adalah contoh non-PII.

Referensi

sunting
  1. ^ a b Pigni, Federico; Piccoli, Gabriele; Watson, Richard (2016-05). "Digital Data Streams: Creating Value from the Real-Time Flow of Big Data". California Management Review (dalam bahasa Inggris). 58 (3): 5–25. doi:10.1525/cmr.2016.58.3.5. ISSN 0008-1256. 
  2. ^ "Federal Standard 1037C data stream". Diarsipkan dari versi asli tanggal April 13, 2007. Diakses tanggal April 4, 2007. 
  3. ^ "Data Stream". techopedia.com. Diarsipkan dari versi asli tanggal April 24, 2019. Diakses tanggal April 24, 2019. 
  4. ^ "Non-Human Traffic [NHT]". theonlineadvertisingguide.com. June 7, 2017. Diarsipkan dari versi asli tanggal August 13, 2017. Diakses tanggal April 24, 2019. 
  5. ^ "BEHAVIORAL PROFILING AND PERSONALIZATION: CUSTOMER EXPERIENCE FIRST". selligent.com. Diarsipkan dari versi asli tanggal April 24, 2019. Diakses tanggal April 24, 2019. 
  6. ^ "What is Targeting – Meaning". selligent.com. Diarsipkan dari versi asli tanggal April 24, 2019. Diakses tanggal April 24, 2019. 
  7. ^ "What is Data Stream and how to use it". OnAudience.com. Diarsipkan dari versi asli tanggal April 24, 2019. Diakses tanggal April 24, 2019. 
  8. ^ "The 6 types of user segmentation and what they mean for your product". uxdesign.cc. June 12, 2018. 
  9. ^ "What is hybrid data management". ibm.com. January 2, 2018. Diarsipkan dari versi asli tanggal April 24, 2019. Diakses tanggal April 24, 2019. 
  10. ^ "What is personally identifiable information (PII)? How to protect it under GDPR". csoonline.com. Diarsipkan dari versi asli tanggal April 24, 2019. Diakses tanggal April 24, 2019.