스파크 행1 [Spark] 구조적 API 기본 연산2 - 로우 [Row Handling] 1) 로우 생성 - 로우의 데이터에 접근할 때는 원하는 위치와 데이터 타입을 지정합니다. 자바나 스칼라를 사용할 때는 명시적으로 데이터 타입을 정의하지만, Python이나 R같은 동적 코드에서는 타입이 자동으로 변환됩니다. import org.apache.spark.sql.Row val myRow=Row("Hello",null,1,false) myRow 2) 로우 필터링 - filter 또는 where 메서드로 로우 필터링 - filter와 where는 똑같은 기능을 하며, - 메서드를 연달아 쓸 경우 메서드의 조건이 AND로 조건이 적용된다. - 다만, 스파크는 자동으로 필터의 순서와 상관없이 동시에 모든 필터링 작업을 수행 // 2) 로우 필터링 : filter 또는 whe.. 2020. 12. 26. 이전 1 다음