sql hadoop 결과값이 중복으로 출력될 때 해결방법
2022. 1. 13. 14:54ㆍProgramming
728x90
아래와 같은 테이블이 있을 경우, 중복된 결과를 제외한 결과값만 확인하고 싶을 때는 아래와 같이 sql을 수정합니다.
SELECT *
FROM table1;
colY colZ
A B
A C
A B
A D
728x90
select 뒤에 distinct를 붙여주는 간단한 방법입니다.
SELECT DISTINCT colY, colZ
FROM table1;
colY colZ
A B
A C
A D
SELECT colY, colZ
FROM table1
GROUP BY colY, colZ;
colY colZ
A B
A C
A D
위의 두 방법은 기능적으로 동일한 쿼리라고 합니다.
반응형
'Programming' 카테고리의 다른 글
[pandas] Getting started (0) | 2022.08.20 |
---|---|
도커 docker 이미지, 컨테이너 다운 받아서 다른 곳으로 옮기기 (0) | 2022.02.28 |
파이썬 패키지 오프라인 설치하기 (How to install python packages offline) (0) | 2022.01.12 |
파이썬 python VarArgs * 별 입력변수 사용하는 방법 (0) | 2021.11.21 |
Colab 파이썬 matplotlib 한글 깨짐 해결하기 (0) | 2021.11.06 |