azure-blob-textfile
텍스트 파일에서 데이터를 조회합니다. 정규표현식으로 사용하여 여러개의 줄로 구성된 데이터의 시작과 끝을 인식시킬 수 있습니다. 텍스트 파일에서 조회한 각 레코드는 line 필드를 포함합니다.
azure-blob-textfile [profile=PROFILE] [offset=NUM] [limit=NUM] [brex=BREX] [erex=EREX] [df=DF] [dp=DP] [cs=CS]
- profile=PROFILE
- Azure 접속 프로파일 이름
- offset=NUM
- 건너뛸 레코드 갯수
- limit=NUM
- 가져올 최대 레코드 갯수
- brex=BREX
- 다수의 줄로 구성된 하나의 레코드를 구분할 수 있도록, 레코드 시작 줄을 판정하는 정규표현식을 입력합니다. brex 정규표현식이 매칭되는 줄이 나오기 전까지 하나의 레코드로 병합합니다. 미지정 시 CR LF 혹은 LF 기준으로 각 줄을 하나의 레코드로 인식합니다.
- erex=EREX
- 다수의 줄로 구성된 하나의 레코드를 구분할 수 있도록, 레코드 마지막 줄을 판정하는 정규표현식을 입력합니다. erex 정규표현식이 매칭되는 줄이 나오기 전까지 하나의 레코드로 병합합니다. 미지정 시 CR LF 혹은 LF 기준으로 각 줄을 하나의 레코드로 인식합니다.
- df=DF
- dp 옵션으로 날짜 추출 정규표현식을 입력하면, df 옵션으로 지정된 타임스탬프 포맷으로 파싱하여 _time 필드를 추출합니다. 미지정 시 _time 필드 값이 데이터 로딩 시점의 시각으로 결정됩니다.
- dp=DP
- _time 필드 추출에 필요한 타임스탬프 포맷을 입력합니다. 예를 들어, yyyy-MM-dd HH:mm:ss.SSS 와 같이 입력할 수 있습니다. 미지정 시 _time 필드 값이 데이터 로딩 시점의 시각으로 결정됩니다.
- cs=CS
- 텍스트 파일의 인코딩을 지정합니다. 미지정 시 기본값은 utf-8입니다.
출력 필드
필드 | 타입 | 이름 | 설명 |
---|---|---|---|
profile | 문자열 | Azure 프로파일 이름 | 미지정 시 전체 Azure 프로파일을 사용합니다. |
_container | 문자열 | 컨테이너 | 컨테이너 |
_file | 문자열 | 파일 | 파일 |
_time | 문자열 | 시간 | 시간 |