Опции чтения

schema_hint

Жесткое указание типа колонки. Полезно в случае, когда колонка имеет тип any (сериализованный в yson сложный тип).
Значение будет десериализовано в указанный тип.

Пример на Python:

spark.read.schema_hint({"value": MapType(StringType(), LongType())}).yt("//sys/spark/examples/example_yson")

Пример на Scala:

df.write
    .schemaHint(Map("a" ->
        YtLogicalType.VariantOverTuple(Seq(
          (YtLogicalType.String, Metadata.empty), (YtLogicalType.Double, Metadata.empty)))))
    .yt(tmpPath)

transaction

Чтение под транзакцией. Подробнее можно узнать в разделе Чтение и запись под транзакцией.

Пример на Scala:

val transaction = YtWrapper.createTransaction(None, 10 minute)
df.write.transaction(transaction.getId.toString).yt(tmpPath)
transaction.commit().get(10, TimeUnit.SECONDS)
В этой статье: