> For the complete documentation index, see [llms.txt](https://deeplearning4j.konduit.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec.md).

# DataVec

- [Overview](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/overview.md): DataVec ETL framework — purpose, architecture, and the data pipeline from raw data to DataSet
- [Schema](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/schema.md): Defining data schemas — Schema, ColumnType, SequenceSchema, and schema inference
- [Record Readers](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/readers.md): RecordReader implementations — CSV, JSON, image, regex, line, and custom readers
- [Transforms](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/transforms.md): TransformProcess — data transformations, column operations, type conversions, and sequences
- [Conditions](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/conditions.md): Conditional operations in DataVec — filtering and transforming data based on conditions
- [Filters](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/filters.md): Data filtering in DataVec — removing records based on conditions
- [Normalization](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/normalization.md): Data normalization in DataVec — normalizer implementations and serialization
- [Operations](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/operations.md): DataVec operations — calculators, reducers, and data analysis tools
- [Reductions](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/reductions.md): DataVec reduction operations — aggregating, grouping, and summarizing records and sequences
- [Analysis](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/analysis.md): DataVec data analysis tools — profiling datasets, detecting quality issues, and computing statistics locally and on Spark
- [Serialization](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/serialization.md): Data serialization in DataVec — saving and loading schemas, transform processes, and normalized data
- [Executors](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/executors.md): Running DataVec transform processes — LocalTransformExecutor and SparkTransformExecutor
- [Records and Writables](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/records.md): DataVec record format — Writable types, Record, and the data representation layer
- [Image Data](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/image.md): Loading and preprocessing image data — ImageRecordReader, NativeImageLoader, and image transforms
- [Apache Arrow](https://deeplearning4j.konduit.ai/en-1.0.0-beta7/datavec/arrow.md): Apache Arrow integration in DataVec — ArrowRecordReader and zero-copy data exchange