Top Big Data Technologies that you Need to know
Big Data Technologies, The Buzz-sana, jota saa kuulla paljon viime päivinä. Tässä artikkelissa, aiomme keskustella uraauurtavaa teknologiaa, joka teki Big Data levittää haaransa saavuttaa suurempia korkeuksia.
- mitä on Big Data-teknologia?
- Big Data Technology
- Top Big Data Technologies
- Emerging Big Data Technologies
mitä on Big Data Technology?
Big Data-teknologia voidaan määritellä Ohjelmistoapuvälineeksi, joka on suunniteltu analysoimaan, käsittelemään ja poimimaan tietoja erittäin monimutkaisista ja suurista tietokokonaisuuksista, joita perinteinen tietojenkäsittelyohjelma ei voisi koskaan käsitellä.
tarvitsemme suuria Tietojenkäsittelyteknologioita analysoidaksemme tätä valtavaa reaaliaikaisen tiedon määrää ja laatiaksemme johtopäätöksiä ja ennusteita riskien vähentämiseksi tulevaisuudessa.
nyt katsotaan, mihin kategorioihin Big Data-teknologiat on luokiteltu:
tyypit Big Data Technologies:
Big Data Technology luokitellaan pääasiassa kahteen tyyppiin:
- Operational Big Data Technologies
- analyyttinen Big Data Technologies
ensinnäkin operatiivinen Big Data on kyse normaalista päivittäisestä datasta, jota tuotamme. Tämä voi olla verkossa tapahtuvia tapahtumia, sosiaalinen Media, tai tiedot tietyn organisaation jne. Voit jopa pitää tätä eräänlaisena raakadatana, jota käytetään analyyttisten Big Data-teknologioiden syöttämiseen.
muutamia esimerkkejä operatiivisesta Big Data-teknologiasta ovat seuraavat:
- Online lippuvaraukset, joka sisältää junaliput, lentoliput, elokuvaliput jne.
- verkkokauppa, joka on Amazon, Flipkart, Walmart, Snap deal ja paljon muuta.
- tietoja sosiaalisen median sivustoilta, kuten Facebookista, Instagram, what ’ s app ja paljon muuta.
- minkä tahansa monikansallisen yrityksen työntekijätiedot.
niin, tämän myötä siirrytään analyyttiseen Big Data-teknologiaan.
analyyttinen Big Data on kuin Big Data-teknologian kehittynyt versio. Se on hieman monimutkaisempi kuin operatiivinen Big Data. Lyhyesti sanottuna analyyttinen big data on se, missä todellinen suorituskykyosuus tulee kuvaan ja ratkaisevat reaaliaikaiset liiketoimintapäätökset tehdään analysoimalla operatiivista Big Dataa.
muutamia esimerkkejä analyyttisestä Big Data-teknologiasta ovat seuraavat:
- Varastomarkkinointi
- avaruuslentojen suorittaminen, jossa jokainen tieto on ratkaisevan tärkeää.
- sääennuste.
- lääketieteen alat, joilla tietyn potilaan terveydentilaa voidaan seurata.
katsokaamme IT-alalla käytettäviä huipputason suuria tietotekniikoita.
Top Big Data Technologies
Top big data technologies jaetaan 4 kenttään, jotka luokitellaan seuraavasti:
- tiedon tallennus
- tiedon louhinta
- Data Analytics
- tiedon visualisointi
tarkastelkaamme nyt kuhunkin luokkaan kuuluvia teknologioita tosiasioineen ja mahdollisuuksineen sekä niitä käyttäviä yrityksiä.
aloittakaamme Big Data Technologies tietojen tallennuksessa.
Tietojen tallennus
Hadoop
Hadoop Framework on suunniteltu tallentamaan ja käsittelemään dataa hajautetussa tietojenkäsittelyympäristössä hyödykelaitteistolla, jossa on yksinkertainen ohjelmointimalli. Se pystyy tallentamaan ja analysoimaan eri koneissa olevia tietoja suurilla nopeuksilla ja alhaisilla kustannuksilla.
-
-
-
-
- kehittämä: Apache Software Foundation vuonna 2011 10 joulukuu.
- Written in: JAVA
- Current stable version: Hadoop 3.11
-
-
-
Hadoopia käyttävät yritykset:
MongoDB
NoSQL-Dokumenttitietokannat, kuten MongoDB, tarjoavat suoran vaihtoehdon relaatiotietokannoissa käytetylle jäykälle skeemalle. Tämän ansiosta MongoDB voi tarjota joustavuutta käsitellessään monenlaisia tietotyyppejä suurilla volyymeilla ja hajautetuissa arkkitehtuureissa.
-
-
-
-
- Kehittäjä: MongoDB in the year 2009 11th of Feb
- Written in: C++, Go, JavaScript, Python
- nykyinen vakaa versio: MongoDB 4.0.10
-
-
-
yritykset, jotka käyttävät MongoDB:
Rainstor
RainStor on ohjelmistoyritys, joka kehitti samannimisen tietokantojen hallintajärjestelmän, jonka tarkoituksena oli hallita ja analysoida suuria tietoja suuryrityksille. Se käyttää Deduplication tekniikoita järjestää prosessin tallentaa suuria määriä tietoja viite.
-
-
-
-
- kehittämä: RainStor ohjelmistoyritys vuonna 2004.
- toimii kuten: SQL
- nykyinen vakaa versio: RainStor 5.5
-
-
-
Rainstoria käyttävät yritykset:
Hunk
Hunk voit käyttää tietoja kauko Hadoop klustereita kautta virtuaalisia indeksejä ja voit käyttää Splunk haku käsittely kieli analysoida tietoja. Hunkin avulla voit raportoida ja visualisoida suuria määriä Hadoop-ja NoSQL-tietolähteistäsi.
-
-
-
-
- kehittämä: Splunk INC vuonna 2013.
- Written in: JAVA
- Current stable version: Splunk Hunk 6.2
-
-
-
siirrytään nyt tiedon louhinnassa käytettävään suureen tietotekniikkaan.
tiedonlouhinta
Presto
Presto on avoimen lähdekoodin hajautettu SQL-Kyselymoottori, jolla voidaan suorittaa interaktiivisia analyyttisiä kyselyjä kaikenkokoisia tietolähteitä vastaan gigatavuista Petatavuihin. Presto mahdollistaa tietojen kyselyt Hivessä, Cassandrassa, Relaatiotietokannoissa ja Omistusoikeudellisissa tietovarastoissa.
-
-
-
-
- Kehittäjä: Apache Foundation vuonna 2013.
- Written in: JAVA
- Current stable version: Presto 0.22
-
-
-
Prestoa käyttävät yritykset:
Rapid Miner
RapidMiner on keskitetty ratkaisu, jossa on erittäin tehokas ja vankka graafinen käyttöliittymä, jonka avulla käyttäjät voivat luoda, toimittaa ja ylläpitää ennakoivaa analytiikkaa. Se mahdollistaa erittäin kehittyneiden työnkulkujen luomisen, Skriptaustuen useilla kielillä.
-
-
-
-
- kehittämä: Rapidmin in the year 2001
- Written in: JAVA
- Current stable version: RapidMiner 9.2
-
-
-
Rapidmineria käyttävät yritykset:
Elasticsearch
Elasticsearch on Lucene-kirjastoon perustuva hakukone. Se tarjoaa hajautetun, Multitenantin kykenevän, Kokotekstisen hakukoneen HTTP-Web-käyttöliittymällä ja Skeemattomilla JSON-dokumenteilla.
-
-
-
-
- kehittämä: Elastinen NV: ssä vuonna 2012.
- Written in: JAVA
- Current stable version: ElasticSearch 7.1
-
-
-
Elasticsearchia käyttävät yritykset:
tämän myötä voimme nyt siirtyä Data-analytiikassa käytettäviin Big Data-teknologioihin.
Data Analytics
Kafka
Apache Kafka on hajautettu suoratoistoalusta. Suoratoistoalustalla on kolme keskeistä ominaisuutta, jotka ovat seuraavat:
-
-
-
-
- Julkaisija
- Tilaaja
- kuluttaja
-
-
-
tämä muistuttaa Viestijonoa tai yritysten viestijärjestelmää.
- Developed by: Apache Software Foundation in the year 2011
- Written in: Scala, JAVA
- Current stable version: Apache Kafka 2.2.0
Kafkaa käyttävät yritykset:
Splunk
Splunk kaappaa, indeksoi ja korreloi reaaliaikaista tietoa haettavissa olevaan arkistoon, josta se voi luoda kaavioita, raportteja, hälytyksiä, kojelautoja ja tietojen visualisointeja. Sitä käytetään myös sovellusten hallintaan, tietoturvaan ja vaatimustenmukaisuuteen sekä liiketoiminnan ja Web-analytiikkaan.
-
-
-
-
- Kehittäjä: Splunk INC in the year 2014 6th May
- Written in: AJAX, C++, Python, XML
- Current stable version: Splunk 7.3
-
-
-
Splunkia käyttävät yritykset:
KNIME
knime antaa käyttäjille mahdollisuuden luoda visuaalisesti tietovirtoja, suorittaa valikoivasti joitakin tai kaikkia Analyysivaiheita sekä tarkastaa tuloksia, malleja ja interaktiivisia näkymiä. KNIME on kirjoitettu Javalla ja perustuu Eclipse ja käyttää sen Laajennusmekanismia lisätoimintoja tarjoavien lisäosien lisäämiseen.
-
-
-
-
- Kehittäjä: KNIME vuonna 2008
- kirjoitettu: JAVA
- nykyinen vakaa versio: KNIME 3.7.2
-
-
-
Knimeä käyttävät yritykset:
kipinä
Spark tarjoaa Muistitietojen laskentamahdollisuuksia nopeuden tuottamiseen, yleistetyn Suoritusmallin tukemaan monenlaisia sovelluksia ja Java -, Scala-ja Python-sovellusliittymät kehityksen helpottamiseksi.
-
-
-
-
- Kehittäjä: Apache Software Foundation
- Written in: Java, Scala, Python, R
- Current stable version: Apache Spark 2.4.3
-
-
-
kipinää käyttävät yritykset:
R-kieli
R on ohjelmointikieli ja vapaa ohjelmistoympäristö tilastolliseen laskentaan ja grafiikkaan. R-kieltä käytetään laajalti tilastotieteilijöiden ja Datankaivajien keskuudessa tilastollisten ohjelmistojen kehittämiseen ja merkittävällä tavalla Data-analyysiin.
-
-
-
-
- Kehittäjä: R-Foundation in the year 2000 29th Feb
- Written in: Fortran
- Current stable version: R-3.6.0
-
-
-
R-kieltä käyttävät yritykset:
Blockchain
BlockChain on käytössä keskeisissä toiminnoissa, kuten maksamisessa, sulkutilissä ja otsikossa, voi myös vähentää petoksia, lisätä taloudellista yksityisyyttä, nopeuttaa liiketoimia ja kansainvälistää markkinoita.
lohkoketjua voidaan käyttää seuraavien asioiden saavuttamiseen Yritysverkostoympäristössä:
-
-
-
-
- jaettu tilikirja: Täällä voimme liittää hajautetun järjestelmän kirjaa koko yritysverkon.
- Smart Contract: liiketoiminnan ehdot sisällytetään transaktiotietokantaan ja toteutetaan transaktioilla.
- Yksityisyys: varmistetaan asianmukainen näkyvyys, tapahtumat ovat turvallisia, todennettuja ja todennettavissa
- konsensus: kaikki yritysverkon osapuolet hyväksyvät verifioidut tapahtumat verkossa.
-
-
-
- kehittäjä: Bitcoin
- kirjoitettu: JavaScript, C++, Python
- nykyinen vakaa versio: Blockchain 4.0
lohkoketjua käyttävät yritykset:
tämän myötä siirrymme Data Visualization Big Data technologies
Data Visualization
Tableau
Tableau on tehokas ja nopeimmin kasvava tiedon visualisointityökalu, jota käytetään Business Intelligence-teollisuudessa. Tietojen analysointi on erittäin nopeaa Kuvaelmalla ja luodut visualisoinnit ovat kojelautojen ja laskentataulukoiden muodossa.
-
-
-
-
- kehittämä: TableAU 2013 May 17th
- Written in: JAVA, C++, Python, C
- nykyinen vakaa versio: TableAU 8.2
-
-
-
yritykset, jotka käyttävät Tableau:
Plotly
käytetään pääasiassa tekemään kuvaajien luominen nopeammin ja tehokkaammin. API-kirjastot Python, R, MATLAB, Node.js, Julia, ja Arduino ja REST API. Plotlya voidaan käyttää myös Jupyter-muistikirjan interaktiivisten kuvaajien muotoiluun.
-
-
-
-
- kehittämä: Plotly in the year 2012
- Written in: JavaScript
- Current stable version: Plotly 1.47.4
-
-
-
yritykset, jotka käyttävät Plotly:
nyt keskustellaan kehittyvistä Big Data-teknologioista
kehittyvistä Big Data-teknologioista
TensorFlow
TensorFlow ’ lla on kattava ja joustava työkalujen, kirjastojen ja yhteisön resurssien ekosysteemi, jonka avulla tutkijat voivat edistää koneoppimisen huipputasoa ja kehittäjät voivat helposti rakentaa ja ottaa käyttöön koneoppimiseen perustuvia sovelluksia.
-
-
-
-
- kehittämä: Google Brain Team vuonna 2019
- kirjoitettu: Python, C++, CUDA
- nykyinen vakaa versio: TensorFlow 2.0 beta
-
-
-
Tensorflow ’ ta käyttävät yritykset:
Beam
Apache Beam tarjoaa kannettavan API-kerroksen kehittyneiden rinnakkaisten Tietojenkäsittelyputkien rakentamiseen, jotka voidaan suorittaa useissa eri Suoritusmoottoreissa tai-Juoksimissa.
-
-
-
-
- kehittämä: Apache Software Foundation in the year 2016 June 15th
- Written in: JAVA, Python
- Current stable version: Apache Beam 0.1.0 incubating.
-
-
-
Beamia käyttävät yritykset:
Docker
Docker on työkalu, joka on suunniteltu helpottamaan sovellusten luomista, käyttöönottoa ja ajamista konttien avulla. Konttien avulla kehittäjä voi paketoida sovelluksen, jossa on kaikki sen tarvitsemat osat, kuten kirjastot ja muut riippuvuudet, ja lähettää sen yhtenä pakettina.
-
-
-
-
- kehittämä: Docker INC vuonna 2003 13 Maaliskuu.
- Written in: Go
- Current stable version: Docker 18.09
-
-
-
Dockeria käyttävät yritykset:
Airflow
Apache Airflow on työnkulun automaatio-ja Aikataulujärjestelmä, jota voidaan käyttää Dataputkistojen kirjoittamiseen ja hallintaan. Airflow käyttää tehtävien suunnatuista Asyklisistä graafeista (Dag )tehtyjä työnkulkuja. Työnkulkujen määrittäminen koodissa helpottaa huoltoa, testausta ja versiointia.
-
-
-
-
- Kehittäjä: Apache Software Foundation on May 15th 2019
- Written in: Python
- Current stable version: Apache AirFlow 1.10.3
-
-
-
airflow ’ ta käyttävät yritykset:
Kubernetes
Kubernetes on toimittaja-agnostinen klusteri-ja konttien hallintatyökalu, jonka Google on avannut vuonna 2014. Se tarjoaa alustan Sovellussäiliöiden automatisoinnille, käyttöönotolle, Skaalaukselle ja toiminnalle Isäntäryhmien välillä.
-
-
-
-
- Kehittäjä: Cloud Native Computing Foundation in the year 2015 21st of July
- Written in: Go
- Current stable version: Kubernetes 1.14
-
-
-
yritykset, jotka käyttävät Kubernetes:
tämä, tulemme loppuun tämän artikkelin. Toivottavasti olen valottanut tietojasi Big datasta ja sen teknologioista.
nyt kun olet ymmärtänyt Big Datan ja sen teknologiat, tutustu edurekan Hadoop-koulutukseen. edureka on luotettava verkko-oppimisyritys, jonka verkosto kattaa yli 250 000 tyytyväistä opiskelijaa ympäri maailmaa. Edureka Big Data Hadoop-sertifiointikurssi auttaa oppijoita tulemaan HDFS -, Lanka -, MapReduce -, sika -, Hive -, HBase -, Oozie -, Flume-ja Sqoop-asiantuntijoiksi käyttämällä reaaliaikaisia käyttötapauksia vähittäiskaupassa, sosiaalisessa mediassa, ilmailussa, matkailussa, rahoitusalalla.