Dolfin: Diffusion Layout Transformers without Autoencoder