Add examples for optimizing onnx graph for inference latency

### Description

> measuring baseline ONNX Runtime latency
> applying graph optimizations manually + via tooling
> comparing execution graphs and performance before/after

### Objective

Take a PyTorch → ONNX exported MLP model and reduce inference latency using ONNX graph optimizations, while maintaining numerical equivalence.

### Deliverables

```
/models
  mlp_baseline.onnx
  mlp_optimized.onnx

/benchmarks
  baseline.json
  optimized.json

/scripts
  export.py
  benchmark.py
  optimize.py
  inspect.py
```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add examples for optimizing onnx graph for inference latency #32

Description

Objective

Deliverables

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Add examples for optimizing onnx graph for inference latency #32

Description

Description

Objective

Deliverables

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions