작은하마

[AWS] Athena와 Redshift Spectrum 차이 본문

AWS

[AWS] Athena와 Redshift Spectrum 차이

꼬몽울 2021. 8. 22. 22:46

최근 면접에서 "Athena와 Redshift Spectrum 차이가 무엇입니까?" 에 대한 질문이 들어와서 적잖히 당황한적이 있었다.

문론 나는 Athena도 Redshift Spectrum(Spectrum)도 둘다 개발을 할 때 유용하게 사용한것들이다.

 

일단 나의 경우로는 Athena는 서버리스 데이터쿼리 방식으로 따로 클러스터가 존재하지않고

Specturm은 레드시프트의 클러스터리소스를 사용한다

또한, 둘 다 Glue의 데이터 카탈로그를 사용하여 S3의 데이터를 읽어오게 되는데 여기서 차이는 Athena는 다른 리전에 있는 S3에 접근이 가능하지만 Spectrum은 동일 리전에 존재해야하는것?

 

아래는 더 정확한 성능 비교를 한 도표이다.

출처 - https://medium.com/nerd-for-tech/crossing-the-ts-athena-vs-redshift-spectrum-ee03cbcf0554

이 표를 보고 내가 놀랬던 것은 비용.

Athena만 S3 데이터의 양에 따라 요금이 부과되는 줄 알았다...

반성해야겠다.

 

결론적으로, Athena는 간단한 쿼리를 이용해서 조회할때 쓰고 spectrum은 대용량 조회나 Redshift의 테이블과 조인을 하거나 그 결과로 테이블을 생성해야 할 시에 유용하겠다.

'AWS' 카테고리의 다른 글

[AWS] AWS EMR과 AWS Glue의 차이  (0) 2021.09.08
[AWS] IaaS, PaaS, SaaS란?  (0) 2021.07.15
Comments