hadoop(2)
-
Hadoop 하둡에서 데이터베이스, 테이블, 데이터 다루기
1. DATABASE 생성/제거하기 1.1 DB 생성하기 # DB의 이름을 cust_dm으로 생성 CREATE DATABASE cust_dm; CREATE DATABASE IF NOT EXISTS cust_dm; 1.2 DB 제거하기 # cust_dm 제거 DROP DATABASE cust_dm; DROP DATABASE IF EXISTS cust_dm; 2. TABLE 생성/제거하기 2.1 TABLE 생성하기 #impala CREATE TABLE cust_dm.table1( id_val INT, cust_key STRING, value1 decimal(5,4), tmstmp TIMESTAMP ) ROW FORMAT DELIMITED #table 구분 세팅 FIELDS TERMINATED BY ',' #..
2022.10.23 -
sql hadoop 결과값이 중복으로 출력될 때 해결방법
아래와 같은 테이블이 있을 경우, 중복된 결과를 제외한 결과값만 확인하고 싶을 때는 아래와 같이 sql을 수정합니다. SELECT * FROM table1; colY colZ A B A C A B A D select 뒤에 distinct를 붙여주는 간단한 방법입니다. SELECT DISTINCT colY, colZ FROM table1; colY colZ A B A C A D SELECT colY, colZ FROM table1 GROUP BY colY, colZ; colY colZ A B A C A D 위의 두 방법은 기능적으로 동일한 쿼리라고 합니다.
2022.01.13