functies zijn gebouwd voor een specifiek doel om bewerkingen uit te voeren zoals wiskundige, rekenkundige, logische en relationele op de operanden van tabelkolomnamen.

ingebouwde functies

dit zijn functies die al beschikbaar zijn in Hive. Eerst moeten we de applicatie-eis controleren, en dan kunnen we deze ingebouwde functies gebruiken in onze applicaties. We kunnen deze functies direct in onze applicatie bellen.

de syntaxis en typen worden in de volgende paragraaf genoemd.

typen ingebouwde functies in Bijenkorf

  • Collectiefuncties
  • datumfuncties
  • wiskundige functies
  • voorwaardelijke functies
  • Stringfuncties
  • Misc. Functies

Collectiefuncties:

deze functies worden gebruikt voor collecties. Collecties betekenen de groepering van elementen en het retourneren van enkele of array van elementen hangt af van het return type vermeld in functienaam.

Return-Type Naam van de Functie Beschrijving
INT grootte(Kaart<K. V>) Het zal halen en geef het aantal onderdelen in het type kaart
INT grootte(Array<T>) Het zal halen en geef het aantal elementen in de array type
Array<K> Map_keys(Kaart<K. V>) Het zal halen en geeft een matrix met de toetsen van de input kaart. Hier is array ongeordend
Array<V> Map_values (Map<K. V>) het zal halen en geeft een array met de waarden van de invoerkaart. Hier is array ongeordend
Array<t> Sort_array (Array<T>) sorteert de input array in oplopende volgorde van array en elementen en geeft het terug

datumfuncties:

deze worden gebruikt om Datummanipulaties en conversie van datumtypen uit te voeren van het ene type naar het andere type:

functienaam Return Type beschrijving
Unix_Timestamp () BigInt we krijgen de huidige Unix-tijdstempel in seconden
To_date (string timestamp) string het zal het datumgedeelte van een tijdstempel string ophalen en geven:
jaar(string date) INT Het zal halen en geef het jaar een deel van een datum of timestamp-string
kwartaal(datum/tijdstempel/string) INT Het zal halen en geven de kwartaal van het jaar voor een date, timestamp, of tekenreeks in het bereik van 1 tot 4
maand(string date) INT Het zal in de maand een deel van een datum-of timestamp-string
uur(string date) INT Het zal halen en geeft het uur van de timestamp
minuut(string date) INT Het zal halen en geeft de minuten van de timestamp
Date_sub(string startdatum, int dagen) string Het zal halen en geeft Aftrekken van het aantal dagen voor begindatum
Current_date datum Het zal halen en geeft de huidige datum aan het begin van de query evaluatie
LAATSTE _day(string date) string Het zal halen en geeft de laatste dag van de maand waarin de datum behoort tot
trunc (string date, string format) string het zal ophalen en geeft de datum afgekapt aan de eenheid die door het formaat wordt opgegeven.
ondersteunde formaten:
maand / MON / MM, jaar / JJJJ / JJ.

wiskundige functies:

deze functies worden gebruikt voor wiskundige bewerkingen. In plaats van het creëren vanudfs , hebben we een aantal ingebouwde wiskundige functies in Hive.

Naam van de Functie Return-Type Beschrijving
ronde(DOUBLE X) DUBBELE Het zal halen en geeft de afgeronde waarde BIGINT van X
ronde(DOUBLE X, INT d) DUBBELE Het zal halen en geeft X afgerond naar decimalen d
bround(DOUBLE X) DUBBELE Het zal halen en geeft de afgeronde waarde BIGINT van X met HALF_EVEN afronding modus
verdieping(DOUBLE X) BIGINT Het zal halen en geeft de maximale waarde BIGINT dat gelijk is aan of minder is dan de X-waarde
ceil(DOUBLE a), plafond(DOUBLE a) BIGINT Het zal halen en geeft de minimale waarde BIGINT dat gelijk is aan of groter is dan de X-waarde
rand(), rand(INT seed) DUBBELE Het zal halen en geeft een willekeurig getal dat wordt gelijkmatig verdeeld van 0 tot 1

Voorwaardelijke Functies:

Deze functies gebruikt voor voorwaardelijke waarden van de controles.

functienaam Return Type beschrijving
if (Boolean testCondition, t valueTrue, t valueFalseOrNull) T het zal fetch en geeft waarde True wanneer Testconditie is van true, geeft waarde False Of Null anders.
ISNULL (X) Boolean het zal Fetchen en geeft true als X NULL is en false anders.
ISNOTNULL (X ) Boolean het zal Fetchen en geeft true als X niet NULL is en false anders.

String functies:

String manipulaties en string operaties deze functies kunnen worden genoemd.

Naam van de Functie Return-Type Beschrijving
reverse(string X) string het geeft de omgekeerde tekenreeks van X
rpad(string str, int lengte, string pad) string Het zal halen en geeft str, wat recht is gevuld met een pad met een lengte van lengte(geheel getal)
rtrim(string X) string Het zal halen en retourneert de tekenreeks die voortvloeit uit het trimmen ruimtes van het einde (rechts) van X Voor voorbeeld, rtrim (‘resultaten’) resulteert in ‘resultaten’
spatie (int n) string het zal ophalen en geeft een string van n spaties.
split (STRING str, STRING pat) array splitst str rond pat (pat is een reguliere expressie).
Str_to_map (text) map<String ,String> het zal tekst splitsen in sleutelwaardeparen met behulp van twee scheidingstekens.

UDFs (Door De Gebruiker Gedefinieerde Functies):

in Hive kunnen gebruikers eigen functies definiëren om aan bepaalde clientvereisten te voldoen. Deze staan bekend als UDFs in Hive. Door de gebruiker gedefinieerde functies geschreven in Java voor specifieke modules.

sommige UDF ‘ s zijn speciaal ontworpen voor de herbruikbaarheid van code in toepassingskaders. De ontwikkelaar zal deze functies in Java ontwikkelen en deze UDFs integreren met de Hive.

tijdens het uitvoeren van de Query kan de ontwikkelaar de code direct gebruiken, en UDFs zal de uitvoer retourneren volgens de door de gebruiker gedefinieerde taken. Het zal hoge prestaties in termen van codering en uitvoering bieden.

bijvoorbeeld, voor string Staming hebben we geen voorgedefinieerde functie in Hive, hiervoor kunnen we stem UDF in Java schrijven. Waar we de functionaliteit van de stam nodig hebben, kunnen we deze stam UDF in Hive direct noemen.

hier betekent stamfunctionaliteit dat woorden worden afgeleid van de hoofdwoorden. Het is alsof het stammen algoritme de woorden “wensen”, “wensen”, en “wensen” reduceert tot het hoofdwoord “wens.”Voor het uitvoeren van dit type functionaliteit, kunnen we UDF schrijven in java en integreren met Hive.

afhankelijk van de use cases die de UDFs kunnen worden geschreven, zal het verschillende nummers van invoer-en uitvoerwaarden accepteren en produceren.

het algemene type UDF accepteert een enkele invoerwaarde en produceert een enkele uitvoerwaarde. Als de UDF die in de query wordt gebruikt, wordt UDF één keer aangeroepen voor elke rij in de resultaatgegevensverzameling.

op de andere manier kan het een groep waarden als invoer accepteren en ook een enkele uitvoerwaarde retourneren.

Posted on

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.